微信扫码
添加专属顾问
我要投稿
RAG正从应用内部流程演变为可复用的基础设施,为AI系统提供持续、动态的检索能力。核心内容: 1. Native RAG的局限性及独立检索层的优势 2. Agentic RAG中检索作为动态工具的工作机制 3. RAG演变为共享基础设施的核心趋势与价值
Anthropic 的 MCP 将检索能力封装为 Agent 可调用的工具;Google 也在 Gemini Agent 体系中通过 MCP 提供检索服务,使检索能力逐渐从应用内部流程演变为独立的基础设施层。
⚡ 核心变化
检索不再只是生成前的一次固定步骤,而是逐渐成为 AI 系统中可复用、可持续运行、可被 Agent 动态调用的基础能力。
Native RAG 在单个应用内部以一次性 Pipeline 的方式运行。知识库需要完成分块、向量化并写入向量数据库。查询时,用户问题会触发向量检索,检索到的相关内容被发送给 LLM,用于生成最终回复。
当答案主要来自变化较少的知识库时,Native RAG 能够取得不错的效果。但随着数据规模和应用数量增加,性能下降明显:
一种改进方式是将检索能力从应用内部抽离出来,构建独立的数据检索层(Retrieval Layer)。在这种架构下,知识入库与查询过程被解耦,数据可以持续同步和更新。
在知识入库阶段,连接器从不同数据源提取内容,完成身份认证、数据采集、实体切分、向量化和索引构建,同时保留元数据、来源信息和版本信息。
同步过程采用增量更新机制,仅处理发生变化的数据,避免对未修改内容重复嵌入。
在查询阶段,请求经过查询扩展、混合检索(向量检索 + 关键词检索)、重排序等流程,最终返回带有来源归属的信息。
💡 复用的关键
检索层不再属于某个具体应用,而是作为独立服务通过 API 或 MCP 对外提供能力,聊天机器人、Agent 和工作流系统都可以共享同一套索引和检索能力。
在 Agentic RAG 中,Agent 会根据当前任务主动判断需要哪些上下文信息,并将检索作为工具动态调用。
Agent 可以发起检索、阅读结果、评估信息是否充分,并根据需要调整查询条件再次搜索,形成“推理 → 检索 → 推理 → 再检索”的循环过程。
此时,Agent 的搜索能力与传统 RAG 应用共享同一条检索链路和同一个知识库。检索不再只是生成前的一次固定步骤,而成为 Agent 推理过程中的基础工具能力。此时,RAG 与 Agent 不再是彼此独立的系统,而是共享同一套检索基础设施。
RAG 的演变并不是让检索变得越来越复杂,而是让检索从一次性 Pipeline 演变为可持续运行、可复用、可被 Agent 动态调用的基础设施能力。检索将像 Web Search 和 API 一样,成为 AI 系统的标准工具。
53AI,企业落地大模型首选服务商
产品:场景落地咨询+大模型应用平台+行业解决方案
承诺:免费POC验证,效果达标后再合作。零风险落地应用大模型,已交付160+中大型企业
2026-06-02
设计生产级 RAG 架构
2026-06-02
万字深度|做了8年向量数据库后,我们决定为Milvus重构AI时代的存储引擎
2026-06-02
PDF2X:教材等高知识密度文档的解析与抽取实战
2026-05-28
ragflow v0.25.6 发布:Browser 自主浏览、RAPTOR 升级、Agent 体验增强与大量稳定性修复全解析
2026-05-27
从文档到智能问答:知识库构建的九步流程
2026-05-22
四种索引,一个系统,重新定义 AI 如何理解知识
2026-05-22
腾讯云Agent Memory节省61% Token提升52%成功率的诀窍:Mermaid无限画布×上下文卸载
2026-05-22
企业知识库下半场:从 RAG 到 context architecture
2026-03-23
2026-04-06
2026-03-18
2026-03-20
2026-04-27
2026-03-31
2026-03-21
2026-04-02
2026-03-17
2026-04-20
2026-05-20
2026-05-18
2026-05-11
2026-05-07
2026-05-06
2026-04-27
2026-04-21
2026-03-17