我要投稿

当RAG拥有“大脑”：揭秘Agentic RAG的进化之路

发布日期：2025-05-15 05:38:30 浏览次数： 1851

作者：AgentLight

微信搜一搜，关注“AgentLight”

前2天我们介绍了有关RAG分块策略，通过优化文本切割方式（如按段落、语义或滑动窗口），让AI更精准地定位资料。但传统RAG仍有硬伤：被动检索、机械拼接答案、缺乏深度推理。

那接下来我们就介绍下Agentic RAG，在技术上对传统RAG进行突破。

RAG限制

检索增强生成（RAG）是一种用于构建 LLM 驱动的应用程序的技术。它利用外部知识源为 LLM 提供相关上下文并减少幻觉。

Naive RAG 由检索组件（通常由嵌入模型和向量数据库组成）和生成组件（LLM）组成。在推理时，用户查询用于对索引文档运行相似性搜索，以检索与查询最相似的文档，并为 LLM 提供额外的上下文。

典型的 RAG 应用程序有两个相当大的限制：

Naive RAG 只考虑一个外部知识源。但是，某些解决方案可能需要两个外部知识源，而某些解决方案可能需要外部工具和 API，例如 Web 搜索。

它们是一次性解决方案，这意味着上下文被检索一次。对检索到的上下文的质量没有推理或验证。

什么是AI系统中的代理

随着 LLM 的普及，出现了 AI 代理和多代理系统的新范式。AI 代理是具有角色和任务的 LLM，可以访问内存和外部工具。LLM 的推理功能可帮助代理规划所需的步骤并采取行动完成手头的任务。

因此，AI 代理的核心组件是：

LLM（具有角色和任务）
记忆力（短期和长期）
规划（例如，反思、自我批评、查询路由等）
工具（例如，计算器、Web 搜索等）

Components_of_an_AI_agent-2f1846374720471d6b11169203ccb865.png

什么是Agentic RAG

Agentic RAG 描述了一种基于 AI 代理的 RAG 实现。具体来说，它将 AI 代理整合到 RAG 中，以编排其组件并执行除简单信息检索和生成之外的其他作，以克服非代理的限制。

3.1 AgenticRAG如何运作？

Agentic RAG 的工作原理是将一种或多种类型的 AI 代理整合到 RAG 系统中。例如，代理 RAG 系统可能会组合多个信息检索代理，每个代理都专门用于特定域或类型的数据源。一个代理查询外部数据库，而另一个代理可以梳理电子邮件和 Web 结果。

具体来说，检索组件通过使用可访问不同检索器工具的检索代理而成为代理组件，例如：

对向量索引执行向量搜索的向量搜索引擎（也称为查询引擎）
Web 搜索
计算器
用于以编程方式访问软件的任何 API，例如电子邮件或聊天程序
....

然后，RAG 代理可以对以下示例检索场景进行推理和作：

决定是否检索信息
确定使用哪个工具检索相关信息
构建查询本身
评估检索到的上下文，并确定是否需要重新检索。

Agentic RAG架构

与顺序的 RAG 架构相比，代理 RAG 架构的核心是代理。代理 RAG 架构可能具有不同程度的复杂程度。在最简单的形式中，单代理 RAG 架构是一个简单的路由器。但是，您也可以将多个代理添加到多代理 RAG 架构中。本节讨论两种基本的 RAG 架构。

4.1单代理RAG（路由器）

代理 RAG 最简单的形式是路由器。这意味着您至少有两个外部知识源，代理决定从哪个源中检索其他上下文。但是，外部知识源不必局限于（矢量）数据库。您也可以从工具中检索更多信息。例如，您可以执行 Web 搜索，也可以使用 API 从 Slack 通道或您的电子邮件帐户中检索其他信息。

Single_Agent_RAG_System_(Router)-ae2ec18616941504070d6b2a7210a358.png

4.2 多代理RAG

正如您可以猜到的那样，单代理系统也有其局限性，因为它仅限于一个代理，集推理、检索和答案生成于一体。因此，将多个代理链接到一个多代理 RAG 应用程序中是有益的。

例如，您可以有一个主代理，负责在多个专用检索代理之间协调信息检索。例如，一个代理可以从专有的内部数据源检索信息。另一个代理可能专门从您的个人帐户中检索信息，例如电子邮件或聊天。另一个代理也可能专门从 Web 搜索中检索公共信息。

Multi_Agent_RAG_System-73e480f62a52e172a78a0ac344dcdcb5.png

Agentic RAG 与 RAG 对比

虽然 RAG 的基本概念（发送查询、检索信息和生成响应）保持不变，但工具使用将其泛化，使其更加灵活和强大。

可以这样想：RAG 就像在图书馆回答特定问题。另一方面，Agentic RAG 就像手里有一部智能手机，里面有网络浏览器、计算器、电子邮件等。

功能	RAG	增强RAG
访问外部工具	no	yes
查询预处理	no	yes
多步检索	no	yes
验证检索到的信息	no	yes

Agentic RAG 框架

LangChain、CrewAI、LlamaIndex 和 Letta 等代理框架已经出现，以促进使用语言模型构建应用程序。这些框架通过将预构建的模板插入在一起，简化了代理 RAG 系统的构建。

LangChain 提供了许多使用工具的服务。LangChain 的 LCEL 和 LangGraph 框架进一步提供了内置工具。
LlamaIndex 进一步介绍了 QueryEngineTool，这是检索工具的模板集合。
CrewAI 是开发多代理系统的领先框架之一。用于工具使用的关键概念之一是在代理之间共享工具。

Agentic RAG 优劣势

优势：

从原版 RAG 到代理 RAG 的转变使这些系统能够产生更准确的响应，自主执行任务，并更好地与人类协作。

代理 RAG 的好处主要在于提高检索到的附加信息的质量。通过添加有权访问工具使用的代理，检索代理可以将查询路由到专业知识源。此外，代理的推理功能可以在将检索到的上下文用于进一步处理之前对其进行一层验证。因此，代理 RAG 可以带来更强大、更准确的响应。

优势：

然而，每枚硬币总是有两面的。使用 AI 代理子任务意味着合并 LLM 来执行任务。这带来了在任何应用程序中使用 LLM 的限制，例如增加延迟和不可靠性。

根据 LLM 的推理能力，代理可能无法充分完成任务（甚至根本无法完成）。重要的是要采用适当的故障模式，以帮助 AI 代理在无法完成任务时摆脱卡顿。

53AI，企业落地大模型首选服务商

产品：场景落地咨询+大模型应用平台+行业解决方案

承诺：免费POC验证，效果达标后再合作。零风险落地应用大模型，已交付160+中大型企业

相关资讯

2025-08-13

再看表格RAG 怎么做？及大模型问数开源项目SQLBot实现解析

2025-08-13

大模型增强检索优化之——用智能体去重构你的RAG系统

2025-08-13

大模型RAG实战｜基于ThinkDoc文档解析与融合检索能力，提升RAG效果

2025-08-11

当AI学会“查资料”：RAG如何让智能回答更靠谱？

2025-08-11

检索增强生成（RAG）：让AI拥有“知识库”能力

2025-08-11

从 RAG 到 KAG ：结构化思考范式下的复杂推理

2025-08-11

构建端到端的高级RAG AGENT

2025-08-11

手搓系列｜MAS+RAG实现博客搜索与问答

了解更多

160+中大型企业正在使用53AI

立即咨询预约演示

把握AI发展的机遇，共同探索、共同进步

2025-01-22

如何打造基于GenAI的员工服务机器人

2025-01-22

热点资讯

2025年GitHub上十大RAG框架深度解析：从技术原理到实战应用

2025-05-30

RAGFlow中的Embeddings模型选择及向量数据库选型与实现分析

2025-06-05

2025-06-06

2025-05-19

2025-06-05

2025-05-20

太好用了！Roo终于出了一个我迫切想要的功能：Codebase Indexing

2025-05-27

知识图谱+RAG：大幅提升智能问答系统准确率

2025-06-05

大模型RAG实战｜生成带有引用来源的回答

2025-05-19

从0到1落地一个RAG智能客服系统

2025-06-20

大家都在问

当AI学会“查资料”：RAG如何让智能回答更靠谱？

2025-08-11

响应速度提升300%、检索准确率90%：RAG如何让企业知识“活”起来赚钱？

2025-08-05

长文本放提示词中还是采用 RAG？

2025-07-28

AI大模型落地最后一公里：RAG？

2025-07-09

向量相似度检索遇到天花板，是否我们走错了？

2025-07-04

RAG检索策略深度解析：从BM25到Embedding、Reranker，如何为LLM选对“导航系统”？

2025-07-01

从碎片到图谱：Graph RAG如何用知识网络颠覆传统搜索？

2025-07-01

qodo如何构建大型代码仓库的RAG？

2025-07-01

热门标签

内容创作大模型技术个人提效 langchain llamaindex 多模态技术 RAG技术智能客服知识图谱模型微调 RAGFlow coze Dify Fastgpt Bisheng Qanything AI+汽车 AI+金融 AI+工业 AI+培训 AI+SaaS 提示词框架提示词技巧 AI+电商 AI面试数字员工 ChatBI 知识管理开源大模型智能营销智能硬件智能化改造 AI+医疗 MaxKB