我要投稿

Zero-RAG，对冗余知识说“不”

发布日期：2025-11-06 06:57:14 浏览次数： 2118

作者：PaperToday

微信搜一搜，关注“PaperToday”

一、LLM 越学越满，RAG 却越搬越重

图 1：知识冗余示意图

(a) Llama3.3-70B 在四个 Wikipedia 风格 QA 数据集上裸模型 Exact-Match 召回 ≥40%——说明近一半问题模型本来就会。
(b) 把对应维基段落再送进上下文，准确率反而掉 20 分——冗余知识成了"噪声"。

结论：外部 corpus 与模型内部知识高度重叠，继续"全量检索"≈ 白花钱、拖延迟、降效果。

二、30% 维基百科可删，22% 延迟立降，效果不减

复旦大学邱锡鹏提出Zero-RAG。首先提出了"掌握度评分"这一指标，用以精准识别RAG知识库中的冗余知识并进行剪除。经过剪枝后，对于模型已"掌握"的问题，其回答将主要依赖模型自身的内部知识。

表 1：主实验汇总（Llama3-70B vs Llama3.3-70B）

在 TriviaQA、EntityQuestions、PopQA、HotpotQA 上砍掉 30% corpus，EM 掉点 <2；砍 70% 也才掉 3 分左右。
检索延迟平均降低22%（表 4）。
经过 Noise-Tolerant Tuning 后，部分数据集反超市售全库 RAG。

一句话："零冗余"不是口号，是真能剪、真加速、真不掉点。

三、技术方案Zero-RAG

图 4：Zero-RAG 四阶段流水线

3.1 Mastery-Score —— 给每条句子打"掌握度"

图 3：Mastery-Score 计算流程

用 LLM 对句子 s 生成 n 组 QA。
让同一 LLM 回答这 n 个问题，算 Exact-Match 均值 ⇒ M(s)。
训练一个小回归模型预测 M(s)，按百分位阈值 τ 直接删掉高分句子（算法见附录 A.1）。

结果：138M 句维基 → prune 30% 后索引体积同比例缩小。

3.2 Query Router ——"会不会"先问模型，别急着搜

表 3：消融实验

把训练集问题先让 Noise-Tolerant 模型自答，能答对的标 mastered。
二分类器学习"是否 mastered"，推理时 mastered 问题直接不走检索，减少延迟 + 避免噪声。

消融显示：拿掉 Router 后 EM 显著下降，证明多检索一次反而添乱。

3.3 Noise-Tolerant Tuning —— 万一搜到废文档，也要稳住

训练数据三种配方：

只给问题 → 答案（无 RAG）
问题 + 相关文档 → 答案
问题 + 随机噪声文档 → 答案

统一损失让模型学会忽略无用片段，靠内部知识作答。
经此微调，即使在 prune 后 corpus 里偶尔捞出无关句，模型也能"视而不见"。

四、一图带走：Zero-RAG 到底剪了什么？

表 6：案例研究

❝
句子："Queen Victoria became Empress of India in 1876."
生成的 4 个 QA 全被 Llama3-70B 裸机答对 ⇒ Mastery-Score=1 ⇒ 直接剪除。

这些"教科书级别"的常识，就是 Zero-RAG 眼中该被"零冗余"的靶子。

Zero-RAG: Towards Retrieval-Augmented Generation with Zero
Redundant Knowledge
https://arxiv.org/pdf/2511.00505

53AI，企业落地大模型首选服务商

产品：场景落地咨询+大模型应用平台+行业解决方案

承诺：免费POC验证，效果达标后再合作。零风险落地应用大模型，已交付160+中大型企业

相关资讯

2026-05-06

RAG 与 MCP：每位 AI 开发人员真正需要了解的知识

2026-04-30

RAG已死？不，是Grep回归了！

2026-04-27

Mem0 深度解析：智能记忆层的架构原理

2026-04-27

Karpathy的LLM Wiki + 3.5 万Star的Graphify：企业级 RAG 缺的真是知识图谱？

2026-04-23

2026 年做搜索就是做 Agent Memory

2026-04-22

专题解读 | 可更新的检索增强知识库发展方向及进展

2026-04-22

AI实践｜基于 Spring AI 从0到1构建 AI Agent

2026-04-22

我搭建了Karpathy的个人知识库，但发现成本高速度慢，我用一个更好的方案替代了。

联系获取

160+中大型企业正在使用53AI

立即咨询预约演示

把握AI发展的机遇，共同探索、共同进步

2025-01-22

如何打造基于GenAI的员工服务机器人

2025-01-22

热点资讯

深度解析 PageIndex：无向量 RAG 框架的技术实现与原理剖析

2026-02-13

RAG 落地全干货深度分享：从“效果不理想”到生产级 RAG 系统的进化之路

2026-02-06

知识基座：让“AI 越用越懂业务”的团队经验实践【天猫AI Coding实践系列】

2026-03-23

告别“伪智能”代码：用 Spec + RAG 打造真正懂你的AI程序员

2026-02-06

全网爆火的大模型AI知识库，保姆级教程来了

2026-04-06

效率神器 Claude-Mem：终结 AI “金鱼记忆”！自动保存上下文、可视化记忆流，开发体验提升 10 倍！

2026-02-06

不用向量数据库的 RAG，居然跑得更准了？

2026-02-22

从RAG到GraphRAG：货拉拉元数据检索应用实践

2026-03-18

为什么总感觉 Claude Code 比 Cursor 聪明？真正的原因根本不是模型能力！

2026-03-20

当RAG遇上Agent记忆：为什么相似度检索会"塌方"？

2026-02-15

大家都在问

Karpathy的LLM Wiki + 3.5 万Star的Graphify：企业级 RAG 缺的真是知识图谱？

2026-04-27

多轮对话时，RAG反复做重复召回，模型层与Milvus层分别如何解决？

2026-04-21

企业AI落地三重门，用友如何破局？

2026-03-17

Embedding相似度虚高，如何用langchain+Milvus搭建CRAG解决？

2026-03-11

不用向量数据库的 RAG，居然跑得更准了？

2026-02-22

当RAG遇上Agent记忆：为什么相似度检索会"塌方"？

2026-02-15

Claude Cowork 真能替换 RAG ？

2026-02-04

使用 Agent Skills 做知识库检索，能比传统 RAG 效果更好吗？

2026-02-03

热门标签

内容创作大模型技术个人提效 langchain llamaindex 多模态技术 RAG技术智能客服知识图谱模型微调 RAGFlow coze Dify Fastgpt Bisheng Qanything AI+汽车 AI+金融 AI+工业 AI+培训 AI+SaaS Skill 提示词技巧 AI+电商 AI面试数字员工 ChatBI AI知识库开源大模型智能营销智能硬件智能化改造 AI+医疗 MaxKB Palantir Glean Openclaw