我要投稿

RAG 已死？不，它将主导AI的未来

发布日期：2025-05-06 20:37:09 浏览次数： 1747

作者：草台AI

微信搜一搜，关注“草台AI”

RAG 已死？不，它将主导AI的未来

每隔几个月，AI圈总会上演一次同样的戏码：一个更强大的模型问世，一项参数上的突破刚刚公布，人们就开始高呼：「RAG已死」。最近一次是Meta发布了拥有千万级上下文窗口的Llama 4 Scout。一夜之间，RAG似乎又一次站在了悬崖边缘。

但问题是，每次人们高喊「RAG已死」的时候，都低估了RAG存在的本质。RAG从来不是为了单纯地扩展上下文窗口，或仅仅弥补模型记忆的缺陷。五年前，当我们在Meta首次提出RAG时，最初的目标其实很简单：把外部知识实时注入模型，以弥补预训练数据的局限。

我们发现的真相是，语言模型无论如何进化，始终无法摆脱三个致命弱点：无法直接访问私有数据、知识的陈旧性、以及频繁出现的「幻觉」。模型总是被困在训练数据所划定的世界边界里，但现实世界并非一成不变，而是高速变化且不断扩张。

很多人以为，既然上下文窗口越来越大，只要把足够多的数据塞进模型，就能解决一切问题。但这种想法显然过于天真。想象一下，你是否每次找答案时都会从头到尾翻一遍教科书？显然不会，这样做不仅低效，而且荒谬。而现在，居然有人在AI领域重复着类似的荒谬逻辑。

真正优秀的工具，从不会要求我们放弃其他工具。一个真正有效的系统，总是依赖多种技术协同工作。计算机中，硬盘、内存、网络接口各司其职，从不会因为内存容量的提升就废弃硬盘。同样，AI的未来也必然不会是单一技术的天下，而是RAG、精调、大型上下文窗口以及其他各种技术彼此融合，各取所长。

人类天生喜欢简单的二元对立，非黑即白，非此即彼。但在技术领域，这种对立往往是虚假的，甚至是误导性的。当人们简单地将RAG与大型上下文窗口、精调、MCP（模型上下文协议）等技术对立起来时，他们忽略了这些技术实际上是互补的存在。过于简单的宣言很容易在社交媒体上传播，但真实世界中的应用永远比口号更复杂、更细致，也更实际。

所以，当下一次你再看到「RAG已死」的高调宣言时，不妨停下来想一想，这是不是又一次误解了技术的本质？也许，那些真正理解RAG本质的人，从不会把它看作是一场技术竞赛的输赢，而是视之为一种必要的基础设施，一种永远不会真正死亡的存在。