2026年6月11日 周四晚上19:30,报名腾讯会议了解“业务抓夹如何成为前线部署工程师(FDE)”(限30人)
免费POC, 零成本试错
FDE知识库

FDE知识库

学习大模型的前沿技术与行业落地应用


我要投稿

RAG不够用了?谷歌推出全新Agentic RAG框架

发布日期:2026-06-08 18:11:15 浏览次数: 1525
作者:模智空间

微信搜一搜,关注“模智空间”

推荐语

Agentic RAG让AI学会“打破砂锅问到底”,通过多智能体协作,彻底解决复杂检索难题。

核心内容:
1. 传统RAG的单次检索瓶颈与业务痛点
2. Agentic RAG的多智能体分工与协同工作流
3. 核心组件“充分上下文智能体”的创新机制

杨芳贤
53AI创始人/腾讯云(TVP)最具价值专家

在当下企业数字化办公场景里,AI 问答、智能检索早已不是新鲜事物。可不少企业使用者都有过类似糟心体验:对着 AI 提出一条跨部门、多数据源的复杂问题,得到的答案要么残缺不全、关键信息缺失,要么凭空编造内容,甚至直接回复 “未查询到相关信息”。

传统 RAG(检索增强生成)之所以频频掉链子,核心问题在于它是一套单向运行的固定流程。简单来说,就是用户提问、系统单次检索资料、模型整合内容输出答案,全程不会二次思考、二次溯源。

面对企业里散落于不同数据库、文档库、业务系统的各种数据,这种单步检索模式完全力不从心。举个很典型的例子,当员工询问 “X 项目所用服务器的详细参数”,传统 RAG 或许能检索到项目文档,找到对应的服务器编号,却不会主动拿着编号去另一套设备数据库继续深挖参数,最终只能给出半吊子答案。

过去两年里,大量技术文章围绕这个问题展开讨论,各类优化方案也层出不穷,但始终没能根治核心缺陷:传统 RAG 并非检索不到信息,而是缺乏主动持续检索的能力。

6 月 5 日,Google Research 发了一篇文章《Unlocking dependable responses with Gemini Enterprise Agent Platform’s Agentic RAG》解决的就是这个问题:让 AI 在做答之前,先确认自己搜到的信息够不够,不够就回去继续搜,直到够了为止。下面我们来详细看一下。

57IFT2ZHABAHO
谷歌Agentic RAG

先帮大家回忆一下RAG是什么,简单来说,就是让大模型在回答之前,先去指定的知识库里搜一圈,找到相关材料后再组织答案。这个办法确实在很大程度上解决了模型乱编的问题。

但问题在于,传统RAG采用的是单步检索模式:用户提问 → 系统搜一次 → 把搜到的内容塞给模型 → 生成答案。这个模式在简单查询场景下挺好用的。可一旦遇到稍微复杂一点的问题,就开始露怯了。

谷歌Agentic RAG本质上就是给RAG配备了一个调研小组,有规划的、有执行的、有质检的,各司其职

  • 根智能体负责理解用户的整体需求,然后分派任务给下面的子智能体。
  • 规划智能体负责判断需要去哪些数据库里找信息,是财务系统、项目文档库、资产登记表,还是客户关系管理系统。
  • 查询改写器把用户的话拆解成多个精准、可搜索的子问题。比如“那个项目的服务器规格”,可能会被拆成“项目名称对应的服务器ID”和“该ID对应的规格参数”等多个搜索片段。
  • 搜索扇出智能体同时对着多个数据库发起并发检索,而不是一个个慢慢问。
  • RAG智能体负责搜集各个片段,拼凑成初步的素材库。
MNUVZ2ZHADAE2

这套流程跑下来,一个需要跨三四个数据库才能回答的复杂问题,系统能一路串联到底,而不是卡在第一步就放弃了。

Sufficient Context Agent

如果说上述设计已经够聪明了,那谷歌这套方案里最核心的其实是Sufficient Context Agent,翻译过来是上下文充分性判断智能体,名字看着有点复杂,但实际做的事情很好理解。也就是在最后生成答案之前,先判定一下当前找到的信息到底够不够用

具体来说,它会干三件事:

1. 检查检索到的文本片段里,是不是真的涵盖了用户问题的核心诉求。

2. 检查当前拼凑出来的草稿答案,是不是回答了问题里的每一个子问题。

3. 如果发现有缺失,那就不交卷,而是生成一份详细的反馈日志,告诉查询改写器“你还差什么信息”,然后触发第二轮精准搜索。

WKJFD2ZHACQFI

这就像一条生产线末端的质检员。产品没做完,就是不放行。而且他不是简单地喊不行重来,而是明确告诉你具体的需求,让上游知道到底该怎么补。

这套闭环机制会反复迭代,持续补全遗漏信息,直到所有缺失的事实都找齐之后,才由综合智能体生成最终答案。

这么做带来的最直接的好处就是系统不再硬猜了

以前很多AI之所以会胡编乱造,不是因为模型本身不行,而是因为检索没找到完整信息,系统又没有停一停再找找的机制,只能硬着头皮往下接。现在有了充分上下文智能体把关,信息不全就直接打回重查,从源头上遏制了幻觉的产生。

谷歌透露,在FramesQA这个专门测试多源多跳查询的数据集上,即使在需要跨4个不同数据库检索的场景中,这套方案依然实现了90.1%的准确率,几乎和单库检索的精度持平。相比标准RAG,在事实性数据集上的准确率最高提升了34%。

5ILCJ2ZHABAHO
以一个具体的医疗场景

光说技术概念可能有点抽象,我们用谷歌官方提供的医疗场景来梳理一遍流程。

假设一位医生问了一个非常具体的患者问题:“xx膝关节手术后的出院用药和饮食限制是什么?住院期间是否出现过过敏反应?不包括仅在住院期间使用的药物,但肝素静脉滴注和替奈普酶除外。”

这个问题涉及三个不同的信息领域:药房系统、营养科记录、临床过敏史记录。

系统接单后,规划智能体迅速识别出需要去三个领域分别搜索。查询改写器把这个问题拆成多个子问题,RAG智能体并行检索。

结果呢?药房和营养科都找到了相关信息,但在最明显的那份病历文件里,完全没有找到过敏反应的记录。

到这里,放在传统RAG系统里,流程就该结束了,药和饮食找到了,过敏没找到,但系统会直接把前两段答案拼凑出来交差,缺了的就是缺了。

但Sufficient Context Agent截住了这个不完整的答案。它发现过敏信息确实缺失了,于是生成反馈:“搜索‘皮疹’或‘不良事件相关记录’。”然后整个循环重来一次,精准补上缺失的信息,最终给到医生一个完整的答案。

EINVT2ZHABQBU
小结

谷歌Agentic RAG 的思路简单点说就是让 AI 回答问题时先不急着开口,先去翻资料;翻不到就再去翻关联资料;资料凑不齐就不交卷,直到所有缺口都补上。

这种设计给我们的最大启发其实是:AI 的可信度不是靠模型参数堆出来的,而是靠检索流程的严谨性兜出来的。对于一个普通用户来说,未来你遇到的那些“明明有答案但 AI 就是找不到”的抓狂时刻,会越来越少。对于企业来说,这意味着终于可以放心地把一些需要跨系统查询、多步推理的工作交给 AI 去跑,而不用担心它给你编出一份错漏百出的报告。

说到底,技术再花哨,最终还是要回到那个朴素的问题:你这个答案,敢不敢让我直接拿去用?

而从 Agentic RAG 这套机制来看,我们离那个敢用的时刻,又近了一步。

如果觉得这篇文章有帮助,欢迎点赞、在看、转发。关注模智空间,获取更多 AI 领域技术解读与行业分析。

53AI,企业落地大模型首选服务商

产品:场景落地咨询+大模型应用平台+行业解决方案

承诺:免费POC验证,效果达标后再合作。零风险落地应用大模型,已交付160+中大型企业

联系我们

售前咨询
186 6662 7370
预约演示
185 8882 0121

微信扫码

添加专属顾问

回到顶部

加载中...

扫码咨询