我要投稿

关于RAG系统在多轮对话中的问题改写(优化)方法—使用历史记录改写问题

发布日期：2025-10-26 21:35:44 浏览次数： 1769

作者：AI探索时代

微信搜一搜，关注“AI探索时代”

“ 基于大模型的RAG多轮对话功能，其检索增强的流程和实际业务的场景可能会存在一定的冲突，而这个平衡点却很难把握。”

在之前的文章中有讲过一个RAG检索优化的方法论，简单来说就是通过对问题进行改写和优化；比如说用户输入一个问题query，但由于我们无法控制用户的行为，因此用户输入的内容query可以是任何东西，包括可能存在错别字，语义错误，甚至是一些无意义内容。

面对这种情况，特别是在多轮对话过程中会导致一个很严重的问题，那就是会严重影响到数据召回的效果。

RAG检索优化——问题改写

关于RAG问题改写的方式有很多，包括但不仅限于问题优化，相似性子问题，假设性回复等等；其本质就是利用大模型的能力来根据完善和增强用户的提问。

但这里存在一个问题就是，在进行问题改写的时候最好能基于历史记录进行改写；为什么要这么做？

举个例子，用户提出一个问题query，怎么学习人工智能技术？然后经过RAG系统的一系列处理，包括文档检索，生成增强等；但用户觉得模型回答的还不够全面；因此，第二个问题是继续，也就是在第一个问题回答的基础之上继续回答，也就是典型的多轮对话场景。

那么随着第二个问题的输入会出现什么情况？

通过数据召回技术，可能会召回一些完全不相关的内容，原因就是其没有完整的上下文，RAG也不知道你这个继续是啥意思，只能根据字面意思进行数据召回，然后再进行生成增强；但我们都知道这是有问题的。

原因在于RAG中，检索和增强是两个步骤而不是一个步骤；检索的目的是使用相似度或其它检索方式从向量库或其它存储中获取参考文档；而增强是在检索回来的文档之上做处理之后，然后让模型使用这些文档做数据增强。

所以，多轮对话中一定要保证上下文的完整性，或者说尽可能的保证上下文的完整性。

虽然说用户之间输入继续可能会召回很多无关文档，但在模型生成阶段依然可以正常的进行回复，这个这个回复更多的是基于模型本身的能力，而不是基于外部知识库；当然，前提是你做了记忆功能。

所以说，这里也体现了问题改写的重要性，如果不进行问题改写，那么基于用户原生的问题，因为丢失上下文因此就会导致文档召回有问题；所以，这里进行改写的时候一定要加入历史记录，这样模型就可以使用历史记录作为上下文，来理解用户的问题；然后生成相关的问题，来进行数据召回，这样就可以大大提升文档召回的准确性，以此来达到增强生成的目的。

但这里同时也存在一个问题，那就是用户的两个问题可能是完全无关的，而这时候使用历史问题来优化用户的当前问题，也可能会导致最终召回的文档不准确；所以，这里还需要想别的方案来解决，然后使其尽可能的达到最优解。

53AI，企业落地大模型首选服务商

产品：场景落地咨询+大模型应用平台+行业解决方案

承诺：免费POC验证，效果达标后再合作。零风险落地应用大模型，已交付160+中大型企业

相关资讯

2025-12-10

最新力作：一招提升RAG检索精度20%

2025-12-10

Apple 入局 RAG：深度解析 CLaRa 框架，如何实现 128x 文档语义压缩？

2025-12-09

客服、代码、法律场景适配：Milvus Ngram Index如何百倍优化LIKE查询| Milvus Week

2025-12-09

一键把碎片变成有料笔记：NoteGen，一款跨平台的 Markdown 笔记应用

2025-12-07

Embedding模型选型思路：相似度高不再代表检索准确（文末附实战指南）

2025-12-06

Palantir Ontology 助力AIP Agent落地工具介绍：Object Query

2025-12-05

把AI记忆做好，是一个价值6千亿美元的市场

2025-12-05

我错了，RAG还没完！AI记忆的结合会成为下一个技术风口

了解更多

了解更多

160+中大型企业正在使用53AI

立即咨询预约演示

把握AI发展的机遇，共同探索、共同进步

2025-01-22

如何打造基于GenAI的员工服务机器人

2025-01-22

热点资讯

RAG彻底爆了！一文掌握其效果优化的架构设计及核心要点

2025-09-15

Embedding与Rerank：90%的RAG系统都搞错了！为什么单靠向量检索会毁了你的AI应用？

2025-10-04

企业级 RAG 系统实战（2万+文档）：10 个项目踩过的坑（附代码工程示例）

2025-10-11

存算一体破局向量检索瓶颈，IBM放出王炸VSM：性能飙升100倍，能效碾压GPU千倍，RAG要变天？

2025-09-30

总结了 13 个顶级 RAG 技术

2025-10-12

大模型生态的“不可能三角”：规模化应用的架构困境？

2025-11-04

Meta如何给RAG做Context Engineering，让模型上下文增加16倍

2025-09-12

RAGFlow v0.22.0 发布：数据源同步、变量聚合、全新管理界面与多项重大更新

2025-11-13

RAGFlow 深度介绍

2025-10-31

任何格式RAG数据实现秒级转换！彻底解决RAG系统中最令人头疼的数据准备环节

2025-10-12

大家都在问

Apple 入局 RAG：深度解析 CLaRa 框架，如何实现 128x 文档语义压缩？

2025-12-10

RAG知识库迎来大洗牌：GraphRAG如何让机器真正读懂世界？

2025-11-23

再谈RAG的文档解析——文档解析的难点在哪里？

2025-11-20

为什么RDF是AI系统的“天然知识层”？

2025-11-19

大模型生态的“不可能三角”：规模化应用的架构困境？

2025-11-04

Embedding与Rerank：90%的RAG系统都搞错了！为什么单靠向量检索会毁了你的AI应用？

2025-10-04

存算一体破局向量检索瓶颈，IBM放出王炸VSM：性能飙升100倍，能效碾压GPU千倍，RAG要变天？

2025-09-30

您应该为您的 RAG 系统使用哪种分块技术？

2025-09-10

热门标签

内容创作大模型技术个人提效 langchain llamaindex 多模态技术 RAG技术智能客服知识图谱模型微调 RAGFlow coze Dify Fastgpt Bisheng Qanything AI+汽车 AI+金融 AI+工业 AI+培训 AI+SaaS 提示词框架提示词技巧 AI+电商 AI面试数字员工 ChatBI AI知识库开源大模型智能营销智能硬件智能化改造 AI+医疗 MaxKB

应聘简历请发送至： ceo@53ai.com

联系我们

售前咨询

预约演示

微信扫码

添加专属顾问

回到顶部