微信扫码
添加专属顾问
我要投稿
利用知识图谱解决RAG问答幻觉问题的新框架,提高答案准确性和鲁棒性。 核心内容: 1. Walk&Retrieve框架的基于知识图谱的语料生成方法 2. 随机游走和广度优先搜索在图遍历中的应用 3. MetaQA和CRAG数据集上的实验性能评估
Walk&Retrieve基于知识图谱,利用基于图遍历和知识表述来进行零样本RAG的语料库生成。解决RAG系统的幻觉问题。该框架思路比较简单,核心点在于零样本RAG的语料库生成,下面来看看,供参考。
在框架中,语料生成该方法的核心步骤。该阶段从知识图谱中提取相关信息,并将其转化为适合LLM处理的文本格式。语料生成包括以下几个步骤:基于图的遍历、知识表示和索引。
随机游走:随机游走是一种随机过程,从一个节点开始,每次以均匀的概率选择当前节点的邻居节点进行移动。
其中, 表示节点 的邻居数量。 对于每个节点 ,生成 条长度为 的随机游走路径 。最终的语料库 是所有节点的随机游走路径的集合。
广度优先搜索-BFS游走:BFS是一种图遍历算法,从根节点开始,逐层访问其邻居节点。对于每个根节点 ,构建一个层次结构,每一层的节点表示与根节点的最短路径距离。然后,按照层次顺序进行遍历,确保每个节点只被访问一次。
其中,, 是最大深度。
LLM需要文本输入,需要将提取的图遍历路径转换为自然语言描述。使用预定义的提示模板,将每个节点的游走路径转化为自然语言句子。例如,对于一个随机游走的路径 ,可以生成类似“ 通过关系 连接到 ,而 通过关系 连接到 ”的句子。
将每个游走路径 转换为向量表示,并计算每个节点的全局表示,作为其所有游走路径向量的拼接。将节点及其对应的游走路径向量存储起来,便于在推理阶段进行快速检索。
该阶段不是重点,与传统的RAG相同,包括将query编码、相似性检索(k近邻搜索)、上下文整合、答案生成。
MetaQA上的性能:Walk&Retrieve-BFS在答案准确性和减少虚假答案方面表现最佳,相对提高了38.64%。其他基于KG的RAG系统虽然准确性高,但虚假答案更多。Walk&Retrieve-BFS在1跳、2跳和3跳问题上的真实性和减少无响应方面表现优异。
CRAG上的性能:Walk&Retrieve变体在答案准确性上优于仅使用LLM和基于文本的RAG,同时在虚假答案和无响应率上与之相当。由于CRAG的复杂性较高,Walk&Retrieve的性能略有下降,但仍表现出良好的鲁棒性。
53AI,企业落地大模型首选服务商
产品:场景落地咨询+大模型应用平台+行业解决方案
承诺:免费POC验证,效果达标后再合作。零风险落地应用大模型,已交付160+中大型企业
2025-10-16
基于大模型的智能问答场景解决方案——RAG提升召回率的关键
2025-10-16
用合成数据评测 RAG 系统:一份可直接上手的 DeepEval 实操指南
2025-10-16
2025 年 RAG 最佳 Reranker 模型
2025-10-16
HiRAG问答流程深入分析
2025-10-13
LightRAG × Yuxi-Know——「知识检索 + 知识图谱」实践案例
2025-10-13
PG用户福音|一次性搞定RAG完整数据库套装
2025-10-12
任何格式RAG数据实现秒级转换!彻底解决RAG系统中最令人头疼的数据准备环节
2025-10-12
总结了 13 个 顶级 RAG 技术
2025-09-15
2025-08-05
2025-09-02
2025-08-18
2025-08-25
2025-08-25
2025-07-21
2025-08-25
2025-09-03
2025-08-20
2025-10-04
2025-09-30
2025-09-10
2025-09-10
2025-09-03
2025-08-28
2025-08-25
2025-08-20