我要投稿

基于KG生成语料增强解决RAG问答幻觉问题的简单框架-Walk&Retrieve

发布日期：2025-05-29 12:25:03 浏览次数： 2012

作者：大模型自然语言处理

微信搜一搜，关注“大模型自然语言处理”

Walk&Retrieve基于知识图谱，利用基于图遍历和知识表述来进行零样本RAG的语料库生成。解决RAG系统的幻觉问题。该框架思路比较简单，核心点在于零样本RAG的语料库生成，下面来看看，供参考。

方法架构

语料生成

在框架中，语料生成该方法的核心步骤。该阶段从知识图谱中提取相关信息，并将其转化为适合LLM处理的文本格式。语料生成包括以下几个步骤：基于图的遍历、知识表示和索引。

1.基于图的遍历

随机游走：随机游走是一种随机过程，从一个节点开始，每次以均匀的概率选择当前节点的邻居节点进行移动。
其中，表示节点的邻居数量。对于每个节点，生成条长度为的随机游走路径。最终的语料库是所有节点的随机游走路径的集合。

优点：简单易行，适用于大规模图谱。
缺点：可能会产生重复路径和噪声。
广度优先搜索-BFS游走：BFS是一种图遍历算法，从根节点开始，逐层访问其邻居节点。对于每个根节点，构建一个层次结构，每一层的节点表示与根节点的最短路径距离。然后，按照层次顺序进行遍历，确保每个节点只被访问一次。
其中，，是最大深度。

优点：避免了重复路径，生成的游走路径更加多样化。
缺点：计算复杂度较高，尤其是在深层遍历时。

2.知识表示

LLM需要文本输入，需要将提取的图遍历路径转换为自然语言描述。使用预定义的提示模板，将每个节点的游走路径转化为自然语言句子。例如，对于一个随机游走的路径，可以生成类似“ 通过关系连接到，而通过关系连接到 ”的句子。

预定义的提示模板

3.索引

将每个游走路径转换为向量表示，并计算每个节点的全局表示，作为其所有游走路径向量的拼接。将节点及其对应的游走路径向量存储起来，便于在推理阶段进行快速检索。

检索问答

该阶段不是重点，与传统的RAG相同，包括将query编码、相似性检索（k近邻搜索）、上下文整合、答案生成。

答案生成prompt模板

实验性能

MetaQA上的性能：Walk&Retrieve-BFS在答案准确性和减少虚假答案方面表现最佳，相对提高了38.64%。其他基于KG的RAG系统虽然准确性高，但虚假答案更多。Walk&Retrieve-BFS在1跳、2跳和3跳问题上的真实性和减少无响应方面表现优异。

CRAG上的性能：Walk&Retrieve变体在答案准确性上优于仅使用LLM和基于文本的RAG，同时在虚假答案和无响应率上与之相当。由于CRAG的复杂性较高，Walk&Retrieve的性能略有下降，但仍表现出良好的鲁棒性。

53AI，企业落地大模型首选服务商

产品：场景落地咨询+大模型应用平台+行业解决方案

承诺：免费POC验证，效果达标后再合作。零风险落地应用大模型，已交付160+中大型企业

相关资讯

2026-02-27

如何用 AI 做业务级 Code Review

2026-02-22

不用向量数据库的 RAG，居然跑得更准了？

2026-02-22

AIOps探索：做运维领域的RAG，如何做数据清洗

2026-02-21

Claude Code 每次都要重新探索代码？这个工具直接省下30%成本

2026-02-18

函数计算 AgentRun 重磅上线知识库功能，赋能智能体更“懂”你

2026-02-15

当RAG遇上Agent记忆：为什么相似度检索会"塌方"？

2026-02-15

查个问题还要全图跑一遍？DA-RAG说我只取一瓢

2026-02-13

深度解析 PageIndex：无向量 RAG 框架的技术实现与原理剖析

联系获取

联系获取

160+中大型企业正在使用53AI

立即咨询预约演示

把握AI发展的机遇，共同探索、共同进步

2025-01-22

如何打造基于GenAI的员工服务机器人

2025-01-22

热点资讯

2026 年你需要了解的 RAG 全解析

2026-01-15

如何用NotebookLM，把枯燥的财报解读成精美的PPT？

2026-01-02

为什么Claude Code不用RAG？

2025-12-23

Embedding模型选型思路：相似度高不再代表检索准确（文末附实战指南）

2025-12-07

从 RAG 到 Context：2025 年 RAG 技术年终总结

2025-12-18

告别向量数据库！PageIndex：让AI像人类专家一样阅读长文档

2026-02-03

企业RAG知识库系统中关于向量数据库的对比选型指南

2025-12-31

使用 Agent Skills 做知识库检索，能比传统 RAG 效果更好吗？

2026-02-03

当 Claude Code 连接 NotebookLM，个人 AI 终于有了“长期记忆”

2026-01-06

Claude Code 外挂最强大脑 NotebookLM Skill

2025-12-29

大家都在问

不用向量数据库的 RAG，居然跑得更准了？

2026-02-22

当RAG遇上Agent记忆：为什么相似度检索会"塌方"？

2026-02-15

Claude Cowork 真能替换 RAG ？

2026-02-04

使用 Agent Skills 做知识库检索，能比传统 RAG 效果更好吗？

2026-02-03

为什么 RAG 越用越慢？如何反向调优？

2026-01-19

NotebookLM如何在48小时内分析2万份论文？

2026-01-12

都有混合检索与智能路由了，谁还在给RAG赛博哭坟？

2026-01-08

如何用NotebookLM，把枯燥的财报解读成精美的PPT？

2026-01-02

热门标签

内容创作大模型技术个人提效 langchain llamaindex 多模态技术 RAG技术智能客服知识图谱模型微调 RAGFlow coze Dify Fastgpt Bisheng Qanything AI+汽车 AI+金融 AI+工业 AI+培训 AI+SaaS Skill 提示词技巧 AI+电商 AI面试数字员工 ChatBI AI知识库开源大模型智能营销智能硬件智能化改造 AI+医疗 MaxKB Palantir Glean Openclaw

应聘简历请发送至： ceo@53ai.com

联系我们

售前咨询

预约演示

微信扫码

添加专属顾问

回到顶部