我要投稿

GraphRAG：让 RAG 看见"关系网络"的技术进化

发布日期：2026-01-23 12:03:59 浏览次数： 1804

作者：百牛技术

微信搜一搜，关注“百牛技术”

最近在折腾 RAG 相关的东西，发现一个挺有意思的现象——传统 RAG 在处理某些问题时简直就是"智商掉线"。

举个具体的例子。我拿《三体》第一部做了个测试（注：选第一部是因为它够短、人物关系也相对简单，方便验证想法，不想被后面那两部复杂的剧情搞晕）：

问它"叶文洁是怎么联系上三体文明的？"，传统 RAG 毫无压力，直接就给你翻到"红岸基地"、"发射信号"这些段落。

但换个问法："ETO 组织到底是怎么搞起来的？里面的人都是什么关系？"，它就抓瞎了。

为啥会这样？说白了，传统 RAG 就像个只会"关键词搜索"的愣头青，它能找到单独的段落，但把这些段落拼不起来。它看不到 A 段落里的叶文洁和 B 段落里的伊文斯其实是一伙的，更理解不了这帮人怎么就搞出了一个全球性的地下组织。

这就是所谓的"见木不见林"。

一、GraphRAG 怎么解决这事儿？

2024 年初，微软研究院扔出来一篇论文《From Local to Global: A Graph RAG Approach to Query-Focused Summarization》，提出了一个叫 GraphRAG 的方案。

核心思想其实挺直白：不用向量相似度去找"相似的片段"，而是先把文档里的实体和关系都抽出来，建成一个知识图谱。然后呢，用 Leiden 算法在这个图谱上找"社区"——就是那些关系特别紧密的一群节点。最后，给每个社区生成一份摘要，让查询的时候能既看到细节又看到全局。

还是那句老话：传统 RAG 是在"翻书找词"，GraphRAG 是在"织网捕鱼"。

先看看传统 RAG 是怎么干活的，代码层面其实就那几步：

这套流程有个致命伤：它根本不理解"关系"。

你问"叶文洁和汪淼有啥关系？"，它大概率会给你两段独立的内容——一段讲叶文洁是谁，一段讲汪淼是谁。但实际上这俩人的关系是通过 ETO 事件串联起来的，这个信息可能分散在好几个不同的章节里，向量检索根本抓不住。

更别提那些跨越整个故事线的问题了，比如"ETO 是怎么从红岸基地的一个小项目变成全球组织的？"——这种问题需要你理解时间线、人物关系、事件因果，传统 RAG 完全搞不定。

GraphRAG 的做法不太一样，它分三个阶段：

这个阶段不是简单切 chunk，而是让 LLM 把每个内容块都嚼碎了，提取出两样东西：

比如原文是"叶文洁收到红岸基地的信号后，向三体世界发射了回复信号"，提取完就变成了：

整个文档跑一遍，你就得到一个完整的知识图谱。拿《三体》第一部来说，最后能出来几十个节点、上百条关系边。

图谱建好了，接下来就该 Leiden 算法登场了。它的作用是在这个关系网里自动发现"社区"——那些关系特别紧密的一群节点。

在《三体》第一部里，Leiden 算法可能会找到这么几个社区：

最关键的是，LLM 会给每个社区生成一份"摘要"。这玩意儿特别有用，相当于把整个关系网络压缩成了几个可理解的知识单元。比如红岸基地社区的摘要可能是"以叶文洁为核心，包括雷志成、杨卫宁等人，是发现外星文明信号的起点"。

有了社区摘要，GraphRAG 就能玩出两种查询方式：

局部模式：从问题里的实体出发，顺藤摸瓜。适合问"叶文洁和伊文斯怎么认识的？"这种具体的关系。

全局模式：把所有相关的社区摘要都捞出来，拼在一起看全局。适合问"ETO 的最终目标是什么？"这种宏观问题。

这个设计挺巧妙的——既保留了微观的细节追踪能力，又有了宏观的全局视角。