微信扫码
添加专属顾问
我要投稿
深入解析RAG系统实施中的挑战与应对策略。 核心内容: 1. RAG系统落地时的8个常见问题概览 2. 知识库资料处理的重要性与优化方案 3. 大模型在RAG系统中的职责与使用误区
关于什么是 RAG,我有零基础级别科普过,你可以点击这里查看。
这篇聚焦落地过程的具体问题及解决方案。
一共 8 个常见问题:
搭建 RAG 产品/系统,90%的功夫应该花在知识库资料处理上。
“巧妇难为无米之炊”。
在 RAG 系统里,AI 大模型只在最后一步发挥价值。这个“巧妇”不可能把“烂树叶”做成一顿能果腹的晚饭。
前面这 7 个常见问题,只有 1 和 5 是由“巧妇”负责的,其他 5 个都因为我们给她投喂了烂树叶。
出现这个问题的根本原因是没搞懂 RAG 的本质。
在 RAG 系统里,大模型只负责两件事:
之所以出现“自作主张”,大部分时候是没有明确大模型的职责
既然选择了 RAG,就意味着我们已经不相信大模型生成的答案里
不相信,就坚持到底:不要一边不信任,一边委以重任。
RAG 系统里,关于角色和任务的标准描述结构:
角色描述:一个没有主观能动性的角色,比如助理
任务情景:接收问题和支持资料,编辑输出文本
任何试图使用如下“祈祷式”提示词约束大模型的行为,都是外行的表现:
核心原因有两个:
是的,“用户的问题”有问题不是用户的问题,是你的问题。
我们不能要求用户都是专业的用户,因为专业的用户大概率不会使用我们的产品……
大部分用户在提问时,不会像我们一样从「知识资料」出发,使用完整、全面的描述。
大部分时候,他们的问题会类似下面这样:
LightRAG 以查询优化狂揽 17K Star 不是没道理的,强烈建议去看一看它们的工程优化。
假设你已经明确了大模型的职责(编辑),那么影响它回答的关键因素就是我们给了它什么参考资料。
选择什么支持资料给大模型,依赖两个因素:
因为资料的形态千奇百怪,当前还没有方案能保证资料被 100% 检索到。
但可以使用如下三个方案来优化:
关于答案排序问题(因素二),一味的花钱买贵的 Rerank 也不是唯一解。
多花些精力调整混合权重、Score 阈值,仔细看看召回答案的特征获取更有效。
出现这种问题的原因基本只有一个:文档分段不合理,完整的答案被切开了。
而只有一段被召回。
解法只有一个,去看召回的段落,重新分段。
不要偷懒使用自定义分段,或者简单粗暴的选择按字符数分段。
另外需要注意一个细节:知识库分段里的“按标识符”分段和“分段最大长度”是同时生效的。
更值得注意的是,那些残缺的答案是大模型幻觉的主要来源!
两个原因:
召回策略里的 Top K 不是越大越好,在没有相似度阈值约束的情况下,召回的段落越多,不相关的答案就越多。
如果你在这个环节没有妥善的解决方案,就只能在最后的“兜底”提示词里下功夫:告诉大模型如何判断哪些答案是有效的,如何剔除不相关段落。
一般情况下,我会在生成最终答案的提示词里加这么一句话:
审视支持资料与用户问题的相关性,有些资料可能被错误的放进来,但它们并不能用户回答用户的问题,你可以选择不取用。
这是一个响应格式问题,它与“没法让 RAG 系统按指定格式生成答案”一样。
本质上是,你在最后的兜底提示词没讲清楚,或者失效了。
这个问题只有两个解法:
所有知识资料都应该被转成 Markdown 后再去分段。
Word、PDF 这类格式是给人看的。
你看到的,跟大模型最终接收到的,会是完全两个面貌。
尤其是图片相关内容
先确保你深刻理解了 RAG 的基本原理,再来思考为什么不显示图片,否则下面的解决方案并不能真正解决问题。
告诉大模型,正确显示 Markdown 或者<img>标记的图片,最好给图片增加注释以方便模型选用。
大模型的首 Token 响应速度,除了受模型本身质量影响外,上下文长度是另一个非常重要的因素。
即便你心疼 Token 费用,也务必从响应速度的角度考虑,对支持资料进行分段处理。
2000 个 Token 可以作为分段长度的上限,再大首 Token 的响应时间就要超出 1 秒了,如果没办法使用流式输出,那么整体的响应时间可能会超过 10 秒。
顺便嘱咐一下团队里成熟的工程师,给 API 响应的 timeout 多留一些时间……
分段带来的最大问题就是知识的碎片化。
“碎片化知识”对 RAG 系统的影响主要在于召回答案的全面性上,不能直接回答问题、但是作为背景信息或具备关联关系的资料几乎不会被检索到。
目前流行的解决方案有以下两个:
个人此刻更看好只是图片增强的策略,Agentic 会涉及到更多工程侧的优化和提示词规训(主要此刻国内模型 Agentic 不了)。
推荐学习微软的 GraphRAG 项目
53AI,企业落地大模型首选服务商
产品:场景落地咨询+大模型应用平台+行业解决方案
承诺:免费场景POC验证,效果验证后签署服务协议。零风险落地应用大模型,已交付160+中大型企业
2025-06-05
关于 RAGFlow 项目中 RAG 技术的实现分析
2025-06-05
RAGFlow中的Embeddings模型选择及向量数据库选型与实现分析
2025-06-05
知识图谱+RAG:大幅提升智能问答系统准确率
2025-06-05
“一代更比一代强”:现代 RAG 架构的演进之路
2025-06-05
使用LangGraph构建一个RAG Agent
2025-06-05
RAG技术全解析:从基础原理到优化实战
2025-06-05
一文吃透 RAG:7大核心概念,通俗易懂
2025-06-04
从传统 RAG 到知识图谱 + Agent,知识库 AI 问答成功率终于达到 95% 了,来自蚂蚁集团的经验
2024-10-27
2024-09-04
2024-05-05
2024-07-18
2024-06-20
2024-06-13
2024-07-09
2024-07-09
2024-05-19
2024-07-07
2025-05-30
2025-05-29
2025-05-29
2025-05-23
2025-05-16
2025-05-15
2025-05-14
2025-05-14