微信扫码
添加专属顾问
我要投稿
复旦大学邱锡鹏团队提出Zero-RAG技术,通过精准识别和剪除冗余知识,实现检索延迟降低22%且效果不降反升。 核心内容: 1. 揭示LLM与RAG知识高度重叠导致的效率问题 2. Zero-RAG三大核心技术方案解析 3. 实验数据证明剪除30%知识库仍保持性能
结论:外部 corpus 与模型内部知识高度重叠,继续"全量检索"≈ 白花钱、拖延迟、降效果。
复旦大学邱锡鹏提出Zero-RAG。首先提出了"掌握度评分"这一指标,用以精准识别RAG知识库中的冗余知识并进行剪除。经过剪枝后,对于模型已"掌握"的问题,其回答将主要依赖模型自身的内部知识。
一句话:"零冗余"不是口号,是真能剪、真加速、真不掉点。
结果:138M 句维基 → prune 30% 后索引体积同比例缩小。
消融显示:拿掉 Router 后 EM 显著下降,证明多检索一次反而添乱。
训练数据三种配方:
统一损失让模型学会忽略无用片段,靠内部知识作答。
经此微调,即使在 prune 后 corpus 里偶尔捞出无关句,模型也能"视而不见"。
❝句子:"Queen Victoria became Empress of India in 1876."
生成的 4 个 QA 全被 Llama3-70B 裸机答对 ⇒ Mastery-Score=1 ⇒ 直接剪除。
这些"教科书级别"的常识,就是 Zero-RAG 眼中该被"零冗余"的靶子。
Zero-RAG: Towards Retrieval-Augmented Generation with Zero
Redundant Knowledge
https://arxiv.org/pdf/2511.00505
53AI,企业落地大模型首选服务商
产品:场景落地咨询+大模型应用平台+行业解决方案
承诺:免费POC验证,效果达标后再合作。零风险落地应用大模型,已交付160+中大型企业
2026-02-06
效率神器 Claude-Mem:终结 AI “金鱼记忆”!自动保存上下文、可视化记忆流,开发体验提升 10 倍!
2026-02-06
告别“伪智能”代码:用 Spec + RAG 打造真正懂你的AI程序员
2026-02-05
向量,向量化,向量数据库和向量计算
2026-02-05
从 RAG 到 Agentic Search,一次关于信任 AI 判断的认知升级
2026-02-04
Claude Cowork 真能替换 RAG ?
2026-02-03
使用 Agent Skills 做知识库检索,能比传统 RAG 效果更好吗?
2026-02-03
告别向量数据库!PageIndex:让AI像人类专家一样阅读长文档
2026-02-02
OpenViking:面向 Agent 的上下文数据库
2025-12-04
2025-12-03
2025-11-13
2025-12-02
2025-11-13
2026-01-15
2025-12-07
2026-01-02
2025-12-23
2025-12-18
2026-02-04
2026-02-03
2026-01-19
2026-01-12
2026-01-08
2026-01-02
2025-12-23
2025-12-21