从RAG到RAG+：让大模型更懂业务的权威指南

发布日期：2025-01-09 19:10:18 浏览次数： 2829

作者：芝士AI吃鱼

微信搜一搜，关注“芝士AI吃鱼”

每当我向非技术背景的朋友解释大语言模型时，我常常用"博学但缺乏实践经验的应届生"作比喻。这些模型确实掌握了海量的知识，但在特定领域的实际应用中，常常会暴露出"经验不足"的问题。就像一位刚毕业的法学生，虽然能流畅地背诵法条，但面对真实的案件时可能会觉得无从下手。

微软亚洲研究院的研究团队近期发布的这篇综述，正是致力于解决这个"经验不足"的问题。这篇论文不仅系统地梳理了检索增强生成(RAG)技术的发展脉络，更重要的是提供了一个全新的视角，帮助我们理解和解决大模型在实际应用中遇到的各种挑战。

为什么简单的RAG还不够用？

让我们先看一个真实的场景。某金融机构尝试用ChatGPT来回答客户的投资咨询问题。为了确保答案的准确性，他们实施了一个基础的RAG方案：把投资产品说明书、市场分析报告等文档接入模型。但实际效果却不尽如人意。

当客户问"这个基金适合我吗？"时，模型往往会直接从产品说明书中摘录风险收益特征。但一个专业的投资顾问会怎么做？

他会先了解客户的投资目标、风险承受能力、投资期限等信息，然后结合市场环境和产品特点给出建议。这种专业的咨询过程涉及到复杂的推理和判断，远非简单的文档检索所能支持。

理解四个层次的知识需求

论文首次系统地定义了RAG应用中的四个层次需求。这个分层框架源于对大量实际应用案例的观察和总结，让我们通过具体例子来理解每个层次：

**第一层是显式事实查询。**比如"公司的退休金政策是什么？"这类问题只需要从员工手册中找到相关段落即可。这是最基础的RAG应用场景。

**第二层是隐式事实查询，需要综合多个信息源。**例如"我现在的工资和工龄，五年后能拿到多少退休金？"这就需要检索并关联多个政策条款，还要进行简单的计算。

**第三层是可解释推理查询，要求理解和运用专业的决策流程。**以医疗诊断为例，医生会遵循"望闻问切"的次序，逐步收集信息，形成诊断。模型需要理解并模仿这种专业的思维过程。

**第四层是隐性推理查询，这可能是最接近人类专家直觉的层次。**比如经验丰富的医生看到某些症状组合，就能联想到可能的罕见病因，这种判断往往基于大量病例经验，而非明确的诊断规则。

走向更智能的RAG解决方案

理解了不同层次的需求，我们就能更有针对性地设计解决方案。

对于第一层的显式事实查询，传统的RAG方案其实已经够用，但在工程实现上还有优化空间。比如文档切分的策略就很关键。如果切分得太细，可能会丢失上下文信息；切分得太粗，又会引入无关信息。一个实用的做法是根据文档的逻辑结构来切分，比如保持完整的段落或章节，而不是机械地按字数切分。

对于第二层的隐式事实查询，核心挑战是如何让模型"主动"获取必要信息。迭代式RAG是一个有效的解决方案：模型先基于初始问题检索一部分信息，发现信息不足时，自动形成新的检索请求，直到收集足够的信息才给出最终答案。

在处理第三层的可解释推理查询时，"提示调优"显示出独特优势。以医疗问诊为例，我们可以设计这样的提示模板：

1. 请先详细了解患者的主诉和症状；
2. 根据症状有针对性地询问病史；
3. 建议必要的检查；
4. 结合所有信息作出初步诊断；
5. 制定治疗方案。

这种结构化的提示能有效引导模型遵循专业的诊疗规范。

第四层的隐性推理查询最具挑战性，因为我们要让模型学习专家的"直觉"。一个可行的方案是构建特定领域的案例库，并通过精心设计的标注来捕捉专家的判断依据。

比如在医疗领域，除了记录最终诊断，还要让专家解释为什么会想到这个诊断，看到了哪些关键线索。这些解释可以帮助模型学习专家的思维模式。

总结

这篇综述不仅梳理了当前RAG技术的现状，也为未来发展指明了方向。一个明显的趋势是，RAG正在从单纯的知识检索，向知识的结构化表达和专业化推理演进。

未来的RAG系统可能会更像一个"数字学徒"，不断从与人类专家的互动中学习和改进。它不仅要会查资料，还要学会专家思考问题的方式。

53AI，企业落地大模型首选服务商

产品：场景落地咨询+大模型应用平台+行业解决方案

承诺：免费POC验证，效果达标后再合作。零风险落地应用大模型，已交付160+中大型企业

相关资讯

2026-06-30

教程：如何用AutoRAG + Milvus避免RAG 与Agent 中出现串租问题

2026-06-30

知识库不是文件堆——我把RAG准确率从60%调到了92%

2026-06-30

本体论语义建设新思路，另类RAG来解决检索问题

2026-06-30

别把RAG当架构：Ontology（本体）才是Agent的业务世界

2026-06-29

PixelRAG：伯克利团队颠覆传统 RAG，用截图代替文本检索! 28 天狂揽 3000+ Star！

2026-06-29

腾讯WeKnora开源详解（三）：检索引擎与生态集成

2026-06-29

腾讯开源WeKnora详解（二）：知识库与对话核心能力

2026-06-29

RAG又被绕开了，MIT用MEMO给AI外挂记忆脑

联系获取

160+中大型企业正在使用53AI

立即咨询预约演示

把握AI发展的机遇，共同探索、共同进步

2025-01-22

如何打造基于GenAI的员工服务机器人

2025-01-22

热点资讯

全网爆火的大模型AI知识库，保姆级教程来了

2026-04-06

Karpathy的LLM Wiki + 3.5 万Star的Graphify：企业级 RAG 缺的真是知识图谱？

2026-04-27

2026 年做搜索就是做 Agent Memory

2026-04-23

RAG进化了，深扒Claude Code源码中RAG高级技巧

2026-04-02

Codeindex · 让大模型更好地理解你的代码

2026-04-20

阿里云百炼「记忆库」正式上线，让龙虾真正记住你！

2026-04-09

YC CEO 的 AI 记住了 3000 个人

2026-04-12

专题解读 | 可更新的检索增强知识库发展方向及进展

2026-04-22

AI 答疑助手优化实践：从 RAG 到 LightRAG 的全链路升级

2026-04-10

2026年知识库幻觉根治指南：从 Naive RAG 到 Agentic RAG

2026-05-14

大家都在问

谷歌发布OKF（Open Knowledge Format）规范，它与Karpathy的LLM-wiki是什么关系？

2026-06-23

RAG 的尽头，是 SQL？

2026-06-23

RAG运维如何用好Loop Engineering？Milvus 3.0 对它有什么价值？

2026-06-15

如何构建一个更“好”的知识库？

2026-06-10

企业 RAG 知识库落地，应如何设计实现？

2026-06-10

AIOps探索：给不能联网的客户做一个AI运维助手到底有多难？

2026-05-20

有多少人把Agent与RAG的检索策略，简化成了 if-else？

2026-05-18

到底是谁会相信RAG已死啊？

2026-05-11

热门标签

内容创作大模型技术个人提效 langchain llamaindex 多模态技术 RAG技术智能客服知识图谱模型微调 RAGFlow coze Dify Fastgpt Bisheng Qanything AI+汽车 AI+金融 AI+工业 AI+培训 AI+SaaS Skill 提示词技巧 AI+电商 AI面试数字员工 ChatBI AI知识库开源大模型智能营销智能硬件 FDE AI+医疗 MaxKB Palantir Glean Openclaw