微信扫码
添加专属顾问
我要投稿
从50%到95%!揭秘提升RAG召回率的实战技巧,让你的AI应用性能翻倍。 核心内容: 1. 传统RAG系统的常见问题与召回率瓶颈 2. 提升召回率的关键技术方案与实施步骤 3. 实际案例中的效果对比与优化经验
在本文中,我会分享一些改进 RAG(检索增强生成)应用程序中检索的出色技术。最近在一个客户项目中使用了这些技术,将系统的召回率从大约 50-60% 一直提高到 95% 及以上。
召回率对于任何 RAG 应用程序来说都是一个非常重要的指标。它虽然只是衡量检索系统为给定用户问题进行搜索或找到正确文档的能力。但是,这会强烈影响生成的结果的好坏——无论我们是在构建聊天机器人还是其他类似的应用。
大多数人现在都知道这一点:如果你不为 LLM 提供必要的上下文,无论你在RAG链的末端做多少提示工程,它都无法产生好的结果。因此,在 RAG 中,获得良好结果的最大因素(通常)是良好的检索。我们衡量这一点的方法就是用召回率。
现在,来详细介绍这个客户项目,以便您可以准确的了解我们做了什么以及我们如何实现超过 95% 的召回率——从而成为一个非常可靠的系统。
设置:经典的 RAG 管线
从高层次视角来看,这是一个非常经典的 RAG 项目。我们构建了一个供内部使用的聊天机器人,专门供客户服务人员更快地查找信息。
基本流程:
机器人从索引中检索相关文档,然后使用该文档生成响应。简单、标准的 RAG。
初始版本:朴素的方法
我们的第一个朴素版本看起来像这样:
在索引方面:
我们有各种各样的数据,但对于这个例子,我们将重点介绍两种文档类型:位置和专家。
这位客户在水疗和健康空间。他们有:
我们将所有相关字段(描述、城市、地区)合并到一个内容字段中以进行文本搜索。我们还创建了该字段的嵌入以进行向量搜索。
用户会键入类似的内容:“赫尔辛基的瑞典式按摩”。
然后,我们将按以下任一方式运行该查询:
我们尝试了两者——但都遇到了问题。
为什么它不起作用
这完全不行。
虽然向量搜索非常适合模糊匹配和语义相似性,但在我们的例子中,我们需要完全匹配——服务和位置。
相反,矢量搜索会返回类似的服务或城市(如芬兰的其他按摩店或其他首都),但并不完全是用户要求的内容。没有帮助。
BM25型
稍微好一点,但仍然不好。
BM25 根据搜索词的频率对文档进行排名。这听起来没问题,直到你意识到:
它不优先考虑完全匹配,而这正是我们的主要需求。
我们还遇到了:
以下是我们如何解决这个问题并将回忆率提高到 95% 以上的方法。
第 1 步:修改索引
我们在搜索索引中添加了一个新字段:services,作为结构化列表,而不是将它们嵌入到自由格式描述中。
但这些数据无法直接获得,因此我们在索引期间使用LLM提取服务。
例如,从位置或专家描述中,我们会提示 LLM 生成:
services: ["Swedish massage", "facial", "deep tissue massage"]
然后,我们完全删除了向量嵌入——它们对我们的需求没有用处。
第 2 步:转换查询
这才是真正的游戏规则改变者。
我们现在没有将用户的原始查询直接传递到搜索中,而是使用 LLM 将查询构建为如下格式:
{"city.fi":"Helsinki","services":["Swedish massage"]}
这样,我们就可以对城市和服务字段运行精确的筛选查询,只获取完全匹配的文档。
在实施这些更改后,我们又进行了一轮用户测试,结果很明显:
这是一个巨大的胜利,通过相对简单和直观的改变来实现。
有时你不需要Agentic RAG 或研究论文中的其他流行技术。你只需要清楚地了解你的实际问题。
在我们的例子中,用户需要特定服务位置查询的精确匹配。这为我们指明了结构化过滤作为解决方案的方向。
虽然 RAG 通常意味着检索增强生成,但它也反过来工作。有各种巧妙的方法可以使用 LLM 来构建更好的检索。
希望这对您有所帮助。
53AI,企业落地大模型首选服务商
产品:场景落地咨询+大模型应用平台+行业解决方案
承诺:免费POC验证,效果达标后再合作。零风险落地应用大模型,已交付160+中大型企业
2025-08-28
自适应RAG:用本地 LLM 构建更聪明的检索增强生成系统
2025-08-28
使用RAG构建高质量知识库(四)- 数据检索
2025-08-28
RAG检索后如何应用更有效?
2025-08-28
RAG 不止能检索!它还能在 LangGraph 中当“工具调用大脑”
2025-08-28
RAG进阶神技:让AI自动将“人话”翻译成SQL和Cypher查询!
2025-08-28
告别“搜不到、搜不准”:用这套查询优化,让你的RAG检索召回率飙升
2025-08-28
比RAG提升27.4%,阿里等ComRAG利用“质心式”记忆机制实现实时社区问答
2025-08-27
如何评估RAG系统:给你的AI助手做个"体检"
2025-06-05
2025-06-06
2025-06-05
2025-06-05
2025-06-20
2025-06-20
2025-06-24
2025-07-15
2025-06-24
2025-06-05