我要投稿

Agentic RAG 目前最强大的RAG实现方式

发布日期：2025-04-05 21:15:50 浏览次数： 2036

作者：数字化助推器

微信搜一搜，关注“数字化助推器”

1 什么是RAG？

RAG 作为一种提升生成式 AI 模型表现的框架，通过检索外部知识源，增强生成内容的准确性与丰富度。AI Agent 则是具备感知、推理、行动和学习能力的自主软件系统，能在复杂环境中完成任务。二者结合，让 AI 系统拥有更强大的功能。

. ?传统 RAG 存在检索时机难定、文档质量不佳、易生成错误信息等问题。Agentic RAG 系统有效解决了这些痛点，在客户支持、内容创作、研究辅助、工作流自动化等场景广泛应用。例如在客户支持中，它能快速检索实时数据，精准回应客户咨询；内容创作时，依托检索知识，在专业领域产出高质量内容。

典型的 RAG 应用有两个相当大的局限性：简单的 RAG 管道仅考虑一个外部知识源。但是，有些解决方案可能需要两个外部知识源，而有些解决方案可能需要外部工具和 API，例如网络搜索。它们是一次性解决方案，这意味着上下文只被检索一次。对检索到的上下文的质量没有任何推理或验证。

一个流行的框架是ReAct 框架。ReAct 代理可以通过将路由、查询规划和工具使用组合成一个实体来处理顺序的多部分查询，同时保持状态（在内存中）。ReAct = Reason + Act（With LLMs）

该过程涉及以下步骤：

思考：收到用户查询后，代理会推断下一步要采取的行动

动作：代理决定一个动作并执行它（例如，使用工具）

观察：代理观察动作的反馈

该过程不断重复，直到代理完成任务并响应用户。

2 什么是Agentic RAG？

Agentic RAG就是一种融合了Agent能力的RAG，而Agent的核心能力是自主推理与行动。所以Agentic RAG就是将AI智能体的自主规划（如路由、行动步骤、反思等）能力带入到传统的RAG，以适应更加复杂的RAG查询任务。

Agentic RAG如何应对这些典型的复杂任务？一起来看。

在不同类型的RAG管道间自主选择（路由），以适应任务的多样性：

融合多种类型的RAG管道与数据源，以适应综合性复杂查询任务：

与必要的外部工具协作，以增强输出的准确性：

. ?Agentic RAG 系统包含多种类型。Agentic RAG 路由器依据查询特性，将任务分配至合适组件，单一路由器适用于简单场景，多路由器则能处理复杂系统的大量查询。查询规划型 Agentic RAG 可通过智能分解、分布式处理和响应合成，高效处理复杂查询。

. ?自适应 RAG 根据查询复杂度选择处理策略，简单问题直接生成答案，复杂问题多步骤检索推理，提高计算效率与回答准确性。主动型纠错 RAG 引入自我纠错机制，评估检索文档，重写查询并结合网络搜索，提升答案质量。自反射 RAG 具备自我反思和逻辑推理能力，动态检索并自评输出，减少幻觉现象。Speculative RAG 利用大小模型分工，小模型起草、大模型核查，实现快速准确回答。Self Route Agentic RAG 让 LLM 判断能否回答问题，合理调用长上下文模型，平衡成本与性能。

. ?Agentic RAG 系统凭借其创新架构与强大功能，在 AI 领域取得显著进展。随着技术不断发展，它将在更多领域发挥重要作用，为 AI 创新奠定坚实基础。

. ⭕为什么需要Agentic RAG❓

Agentic RAG的“智能体”特征主要体现在检索阶段，相对于传统RAG的检索，

Agentic RAG更能够：

?决定是否需要检索

?自主决策使用哪个检索引擎

?自主规划使用检索引擎的步骤

?评估检索到的上下文，并决定是否重新检索

?自行规划是否需要借助外部工具

. ⭕Agentic RAG 的应用

✅客户支持：通过访问实时数据源，自动检索并提供准确的用户查询响应。

✅内容创作：生成复杂领域（如法律或医疗）中的上下文丰富的内容，依托于检索的知识。

✅研究辅助：通过自主收集和综合来自广泛数据库的相关材料，帮助研究人员。

✅工作流自动化：通过将基于检索的决策集成到企业流程中，简化企业运营。

Agentic RAG 架构

与顺序式简单 RAG 架构相比，代理式 RAG 架构的核心是代理。代理式 RAG 架构可以具有各种复杂程度。在最简单的形式中，单代理 RAG 架构是一个简单的路由器。但是，您也可以将多个代理添加到多代理 RAG 架构中。本节讨论了两种基本的 RAG 架构。

单代理 RAG（路由器）

最简单的形式是，agentic RAG 是一个路由器。这意味着您至少有两个外部知识源，代理决定从哪个源检索其他上下文。但是，外部知识源不必局限于（矢量）数据库。您也可以从工具中检索更多信息。例如，您可以进行网络搜索，或者您可以使用 API 从 Slack 频道或您的电子邮件帐户检索其他信息。

多代理 RAG 系统

正如您所猜测的，单代理系统也有其局限性，因为它仅限于一个代理，集推理、检索和答案生成于一体。因此，将多个代理链接到多代理 RAG 应用程序中是有益的。

例如，您可以让一个主代理协调多个专门检索代理之间的信息检索。一个代理可以从专有的内部数据源检索信息。另一个代理可以专门从您的个人帐户（例如电子邮件或聊天）检索信息。另一个代理还可以专门从网络搜索中检索公开信息。

Agentic RAG 与普通RAG

虽然 RAG 的基本概念（发送查询、检索信息和生成响应）保持不变，但工具的使用对其进行了概括，使其更加灵活和强大。

可以这样想：普通（原始）RAG 就像在图书馆（智能手机出现之前）回答特定问题。另一方面，Agentic RAG 就像手中拿着一部智能手机，上面有网络浏览器、计算器、电子邮件等。

从原始 RAG 到代理 RAG 的转变使得这些系统能够产生更准确的响应、自主执行任务并更好地与人类合作。代理 RAG 的优势主要在于提高了检索到的附加信息的质量。通过添加具有工具使用权限的代理，检索代理可以将查询路由到专门的知识源。此外，代理的推理能力使检索到的上下文在用于进一步处理之前能够进行一层验证。因此，代理 RAG 管道可以带来更稳健、更准确的响应。

Agentic RAG 的局限性

然而，任何事物都有两面性。使用 AI 代理执行子任务意味着要结合 LLM 来完成任务。这带来了在任何应用程序中使用 LLM 的局限性，例如增加延迟和不可靠性。根据 LLM 的推理能力，代理可能无法充分完成任务（甚至根本无法完成）。重要的是要结合适当的故障模式，以帮助 AI 代理在无法完成任务时摆脱困境