我要投稿

GraphRAG 在 CVTE 多业务场景下的探索与应用

发布日期：2025-06-16 07:32:26 浏览次数： 2413

作者：DataFunSummit

微信搜一搜，关注“DataFunSummit”

导读本文将分享视源股份（CVTE）利用 GraphRAG 技术在智能教育与智能客服两大核心场景的探索与应用，从技术原理、框架选型到落地实践，全方位呈现其创新路径与显著成效。

文章主要包括以下几大部分：

1. GraphRAG 简介及框架

2. 智能教育场景

3. 智能客服场景

4. 未来工作

5. 问答环节

分享嘉宾｜张世鸣视源股份（CVTE）研究员

编辑整理｜卢学林

内容校对｜李瑶

出品社区｜DataFun

GraphRAG 简介及框架

RAG 已为大家所熟知，其核心思想是借助外部可靠的知识库增强上下文知识，助力大模型实现更全面、准确的生成。该知识库主要涵盖文本和图像类数据，且这些数据内部不存在关联关系。GraphRAG 的处理流程与 RAG 较为一致，从知识库构建、用户查询、数据检索组织，到最终输入大模型生成相应的响应。二者的根本区别在于底层的数据组织方式，GraphRAG 以图结构组织数据，粒度更细，能有效表达领域内及领域间的关联关系。此外，图相关的算法和技术种类繁多，使得 GraphRAG 在应用上比普通 RAG 更灵活，适用场景也更丰富。

GraphRAG 各阶段涉及的关键技术点：

Query Processor 阶段：此阶段主要处理查询语句，使其与知识库中的知识更匹配。常用技术包括命名实体识别与关键抽取，以及对查询进行结构化处理的相关技术，如 Text2GQL，还有复杂查询的多步分解与语义增强等。
Retriever 阶段：首先是基于启发式的方法，即依据预定义的规则和目标高效探索图路径；另一种是基于学习的方法，通过模型学习高阶图结构特征和深层次语义，泛化性能更佳；此外，还有将二者结合的神经加符号集成的方式，在实际应用场景中颇为常用。
Organizer 阶段：主要对 Retriever 结果进一步操作，去除无关信息，优化信息结构，确保输入大模型的数据具有较高质量。
Generator 阶段：即大模型的生成。

GraphRAG 的底层数据源可以是任何形式的图结构，如知识图谱、社交关系图、文档图，甚至分子结构图等。从整体来看，GraphRAG 在各阶段的技术方案和技术点众多，可灵活组合，因此选择合适的框架至关重要。目前 GraphRAG 的框架有微软的 GraphRAG、LightRAG 等。

CVTE 因自身业务场景多、数据量大的特点，在早期底层图数据库选型时采用了分布式图数据库 Apache HugeGraph。团队在大模型发展早期，就开始探索如何将数据库中海量的 Graph 数据与大模型结合，以发挥更大价值。在前年 9 月，提出了 HugeGraph-AI 框架的设想，旨在与社区协作，使 Graph 和大模型更顺畅地结合，应用于更多场景，即当前所探讨的 GraphRAG。发展至今，Apache HugeGraph 已不仅是一款分布式图数据库，还涵盖一整套图生态组件，包括最底层的分布式存储；上层的分布式图数据处理框架，集成了 Flink 和 Spark，可灵活进行批量和实时数据处理；再上层独立的分布式图计算框架，可用于 OLAP 场景下的高效图遍历分析；以及 HugeGraph-AI 框架。

下面来具体介绍 HugeGraph-AI 框架。

图谱构建：即知识的在线抽取与实时节点融合，数据最终存入 HugeGraph，并支持在线可视化编辑。

图数据深度探索：构建好图后，可基于分布式图计算模块对图数据进行深度探索，如社区发现、图路径遍历算法等。整个流程中，图算法可通过简单的参数配置和接口调用实现，且底层执行逻辑基于分布式设计，执行效率高。

GNN 数据准备与训练推理：框架内置 GNN Adapter 模块，可高效从底层图数据库抽取和构建 GNN 所需的数据结构与特征。数据准备好后，可基于内置的 GNN 算法，或通过 adapter 接入第三方 GNN 库进行 GNN 的训练与推理。

查询结构化模块：即 Test2GQL 模块，主要将自然语言转化为图查询语句，整个流程包括从 query 到 GQL 的构建、相似 GQL 的召回、语法检查、语句执行，并基于反馈进行多次调整，生成最终结果供大模型做生成。

除此之外，HugeGraphAI 还有更多功能正在规划和推进中，感兴趣者可参与共建，项目链接如上图中所示。

智能教育场景

希沃是 CVTE 旗下教育领域的自有品牌，产品包括教师上课使用的智慧黑板、智能讲台、录播设备等硬件，以及运行在这些硬件设备上的软件，如课堂观察、希沃白板、班级优化大师、希沃易课堂等，覆盖了课前、课中、课后的整个教学流程，涉及学生、家长、教师等角色，积累了海量数据。如何最大化发挥这些数据的价值，是关注的核心。

从底层数据来看，上图中列举了教育领域的四个常见子图：学习知识点、概念、习题和学生。知识点之间存在包含、递进、并列等关系，如函数与一次函数是包含关系；概念是知识点的进一步细分，用于更详细解释和描述知识点；习题内部有难度递进等关系及特征信息；学生除基本特征信息外，后续大部分关系围绕其构建，因为学生是应用的主体。

基于学生构建的关系包括学生对知识点的掌握度关系、学生与习题的关系，以及习题与知识点、习题之间的关系。其中边分为实线和虚线两种类型，实线表示显式关系，可通过固定规则或逻辑提取和生成；虚线表示隐式关系，是数据中潜在的深层次关联关系，需通过复杂算法从数据中间接挖掘。例如，通过课本可知章节与知识点的关系，但学生与知识点的关系无法通过固定规则计算，需利用隐式关系构建方法间接挖掘。

首先来看一下显示关系构建。

前文中提到的一些关键元素，其中概念是知识点的进一步细分，知识点是章节的组成单元，章节是教材的组织结构。这四个实体之间的关系明确，如一本教材或教辅书籍，可根据目录切分为若干章节，章节内可划分为多个文本块，在文本块内识别和抽取知识点与概念，并依据目录结构将知识点、概念和章节关联起来。此外，一个章节可能涉及多个知识点，章节间相同知识点需合并，以构建全面的知识点图谱。为此设计了 memory 模块，对每个 chunk 的知识点和概念进行融合，确保知识点的全局一致性。

完成这些操作后，可得到若干知识点子图，基于此可以进一步探索知识点和概念的深度关系，如通过图中心算法找到关键节点，或通过数据发现算法找到相似知识点并聚合，辅助理解知识点之间的关系。同时，summary 操作会对 chunk 或社区进行总结，chunk 因与知识点构建时相关联，检索时可提供知识点出处信息，为检索和推荐提供更多知识上下文。

例如，构建好图谱后，在对题目涉及知识点进行解析辅助教学时，一方面可通过大模型总结题目中涉及的知识点，如对二次函数性质做摘要；另一方面从题目中提取关键概念词，如最大值和最小值，将知识点摘要和关键概念关键词映射到图谱中的知识点和概念节点上，召回相关 chunk 和节点的多跳子图信息，最终输入大模型生成题目解析报告。但在图结构复杂场景下，该方式效果可能欠佳，后文中将介绍优化方案。

接下来是隐式关系的挖掘，这部分相对复杂一些。

教育领域有两个热门研究方向：认知诊断和知识追踪。认知诊断旨在获取学生当前的知识状态，即对知识点的掌握度（对应上述虚线边）；知识追踪通过分析学生学习行为和历史答题记录，动态建模学生做题行为和知识点变化，预测其未来在习题上的表现，即习题准确率。通常预测学生表现需通过知识状态，所以知识追踪模型也会涵盖知识诊断的功能。下面来看一下如何基于知识追踪技术构建关注的两条隐式关系。

数据方面，最上面 1 到 15 表示学生做的习题，不同颜色代表不同知识点，× 和 √表示习题对错，还有答题时间和每次答题的时间间隔。下面的热力图表示知识状态，不同值表示完成对应题目后对知识点的掌握情况。可以看到，每次做完题目，知识点状态都会变化。这里有一些关键点，学生做错题也会有学习增益，但多次做错同一知识点相关题目，学习增益会下降；时间间隔长也会导致知识掌握程度下降。

以基于深度学习的一个典型例子来讲解具体的实现方式。LPKT 模型，主要分为学习模块、遗忘模块和预测模块。学习模块负责建模学生与上一次学习相比的学习增益，其基础数据由学习单元组成，学习单元包含习题、答题时间、答题结果，拼接两次答题时间间隔和当前题目之前的知识状态，由此算出学习增益。但并非所有学习增益都能完全转化为学生掌握度，因此设计了学习门控制知识吸收，得到实际学习增益值输入下一个模块。

根据遗忘曲线，学生掌握的知识会随时间推移遗忘，所以遗忘模块设计了遗忘门，同样拼接当前知识状态、学习增益和时间间隔，通过遗忘门消除遗忘影响，更新学生完成第t次做题行为后的知识状态。

预测模块将知识状态乘以下一个学习单元的知识点向量，得到下一个学习单元的知识状态，再与下一道题的向量拼接，通过 sigmoid 输出 0 或 1 的值，即学生在下一道题目上的表现，基于实际表现计算损失，反向传播优化模型。

最终通过该模型可计算出学生对知识点的掌握度和学生到习题准确率预测的边，基于此可进行题目推荐。

但此前未考虑知识点之间的关联关系，虽通过 chunk 构建了知识点关系，但只能捕捉到相关性，无法体现相互影响程度。例如，知识点 A 掌握度低，若 B、C、D 与 A 相关，三者是否都需优先掌握，若有更多相关知识点，如何确定先后顺序等，因此需构建知识点之间的影响关系，即因果关系。

因果关系通过因果推断方法推理得出。因果推理用于识别变量之间的因果关系并量化影响效应。基于上述场景，需估算掌握知识点 A 对知识点 B 的影响效应。解决该问题前，需确认一些信息：在前面环节已构建知识点之间的关联关系，即基本因果结构图。但实际场景中，A 对 B 的影响可能受其他变量干扰，如 E、F 指向 A 和 B 节点，C 指向 A 节点，所以需识别干扰 A 对 B 影响的变量，即混淆变量。

后门准则是识别混淆变量的常用方式。例如，A 和 B 之间有 AEB、AFB、AB 三条路径，后门准则定义中，Z 是混淆变量集合，需满足：

集合 Z 中没有 X 的后代节点：图中 C 和 F 都不是 A 的后代节点，符合条件；
Z 阻断 X、Y 之间每条指向 X 的路径：图中 A 到 B 的路径中，指向 A 的路径有 AEB 和 AFB 两条，E 和 F 阻断了这两条路径，符合条件。

所以找到的混淆变量集合为 E 和 F。

确定混淆变量后，需排除其影响，这里介绍两种常用方式：

基于倾向性得分的方式：通过匹配、加权和分层方式估计对照组和处理组之间的平均影响效应。在该场景中，处理组为掌握 A，对照组为未掌握 A。此方式核心是平衡处理组和对照组干扰变量的分布，减少选择偏差，适用于处理低维简单的因果关系。
基于双重机器学习的方法：适用于处理更高维数据。分别用混淆变量预测结果变量和干预变量的值（即 A 和 B 知识点的掌握度），用实际值减去预测值得到残差，这两个残差可理解为结果变量和干预变量中未被混淆变量解释的纯净部分，直接对这两个残差进行线性回归，回归系数即为 A 对 B 的实际因果影响效应。

构建完成图后，下一步是 retrieval 操作。基于图结构的 retrieval 常用方式是基于图遍历算法，如通过节点映射获取节点的两到三跳的子图作为上下文补充给大模型去做生成。但图遍历易出现信息过载问题，如基于 BFS 方式，随着遍历步数增加，领域呈指数级扩张，引入大量无关信息。更好的方式是添加规则，有选择地探索最相关的邻接节点。

例如，在学情报告场景中，若需了解学生 A 对章节 B 涉及知识点的掌握情况，基于此上下文可映射到学生、章节、知识点及掌握度等众多实体和关系，可基于已知的掌握度边确定遍历方向，或通过最短路径连接各实体，获取它们之间的关联关系，避免信息过载。

另一场景是了解整个班级对章节B涉及知识点的掌握情况，该场景不是从单个节点出发，而是针对整个班级所有学生，需进行批量图遍历聚合分析，此场景适合通过 HugeGragh 框架实现。首先通过 Text2GQL 将逻辑转化为图查询语言，涉及全图遍历时可调用分布式图计算引擎进行高效的分布式计算，得到最终结果。

由于学生知识状态随做题量动态变更，学情报告可从 HugeGragh 获取多个时间段的子图进行对比分析，更好地评估学生表现和变化情况，这也是图增强的一种方式。

整体而言，图遍历算法是 GraphRAG 应用中常用的 retrieval 方式，可高效探索图结构，但通常不考虑图节点之间的权重或检索目标的特定信息，在需要路径优化的场景中可能表现不佳，如个性化复习路径规划场景，需基于启发式搜索算法进行 retrieval。

启发式搜索算法的优势在于利用启发式信息，提高搜索效率，减少搜索空间，避免盲目搜索，快速达到搜索目标。在个性化复习路径规划场景中，规划的是知识点路径，基于学生对知识点的掌握度和知识点之间的因果效应，搜索收益最大的复习路径，提升学生知识状态。

基于此上下文建模，决策变量是不同知识点组成的组合，目标是找到一条路径，最大化当前学习掌握度增益（直接收益）和掌握当前知识点对后续的促进增益（间接收益）。目标函数由这两部分组成，其中 L 指路径遍历长度，β 是权重参数，用于控制直接收益和间接收益的平衡。β 越接近 0，对后续影响越大，适合基础较好、更看重长远影响的学生；β 接近 1，则需优先掌握当前知识点，适合基础薄弱的学生。求解过程中还需注意一些约束条件，如每天复习的知识点数量、知识点之间依赖的先后关系、同一个知识点出现的次数等。

启发式算法适合解决此类搜索优化问题，可通过启发式规则引导和特定经验知识高效探索解空间，找到最优解。但启发式算法泛化能力有限，后续将介绍与之互补的基于学习的 retrieval 方式。

在题目涉及知识点解析场景中，借鉴 global search 思想，通过大模型抽象出题目知识点，再与图中的 summary 做映射，但效果受大模型生成质量的影响，在复杂场景下生成题目与知识关系的效果可能不理想。因此，在图关系预测场景中，图神经网络更为合适，尤其在前面已经构建好了异构图的情况下。此时需提取习题与知识点的关联关系，如习题与知识点、习题与概念、概念与知识点、学生与做题、学生与知识点掌握度等关系，还需已知的习题到知识点的监督数据。

有了节点特征和拓扑结构后，通过多层图神经网络进行消息传递聚合，逐步融合节点自身特征和领域信息，最终生成包含图结构语义的节点向量，基于这些向量计算节点相似度，预测节点对之间不同类型边存在的概率，再根据实际值计算损失，反向传播更新参数，优化模型。这是一个完整的 GNN 过程。在教育场景中，除了预测习题节点到知识节点的链接关系外，图神经网络还可用于题目推荐、关系挖掘、标签预测等。

回到题目和知识点关联关系的场景中，在预测出关系后，可结合图遍历的方式做更多探索，如 GNN-RAG 方式。首先通过 GNN 获取若干相关度高的知识点，再通过实体识别方式从题目中提取相关概念，获取知识点到概念之间的最短路径，该路径可协助更详细分析题目涉及的所有知识点，进行更全面的知识点解析。此外，还可通过类似方式做大模型的节点或路径增强，最终通过大模型生成完整的题目解析信息。

GraphRAG 的最后一步是 Generate，直接面向业务即具体的应用场景进行输出。再来总结一下主要的场景：

学情诊断场景：基于学生对知识点的掌握度生成，帮助教师及时调整教学策略。
学生学习报告：通过构建隐式关系及后续 retrieval 获取相关信息，刻画学生学习特征，提供整体的学习建议。
个性化学习路径规划：基于知识状态和因果影响效应，定制学生收益最大化的学习路径。
学习资源推荐：确定学习路径后，可基于知识状态和学生对习题的准确率预测进行学习资源推荐。
学习资源生成：若实际场景中部分章节学习资源缺失，可利用大模型的通用能力生成相应题目和试卷资源，但这些资源需进一步审核后才能面向学生开放。

智能客服场景

接下来介绍智能客服场景。

在前面介绍的教育场景中有众多软硬件设备，在运行过程中无法避免地会出现一些异常问题，需要客服协助用户定位和解决。智能客服应用于与客户沟通排查故障的过程，用户首先通过智能客服提供的虚拟坐席进行沟通，若虚拟坐席无法解决问题，则切换到人工坐席深入沟通。

该场景存在几个核心问题：智能客服更像工程师角色，需通过与用户的多轮对话获取更多上下文，理解用户意图并进行故障推理，过程复杂；对话中涉及不同设备及其型号、配置、物料等信息，需动态分析在何种情况下获取何种业务数据补充上下文；另外，在实际客服场景中，用户会发送图片，为使用户更好理解操作步骤和位置，客服有时也需发送图片，因此何时发送及发送何种图片也是需要重点考虑的问题之一；由于客服场景直接面向用户，故障排查要求准确率较高，而大模型存在幻觉问题，如何平衡二者是一个关键问题。

从数据出发，此场景的图结构较为特殊，为贝叶斯网络。贝叶斯网络是一种概率图模型，通过有向无环图表示一组随机变量及变量之间的条件依赖关系。每个节点都有一张条件概率表，由变量、变量取值及其条件概率组成。

例如，对于 E 节点，C 和 D 是其父节点，第一行表示当 C 和 D 都为 T（True）时，E 为 T 或 F（False）的概率。基于这种概率分布，运用贝叶斯定律和全概率公式，就能依据已知变量的观测值，对其他变量进行概率预测。

具体来讲，应用可划分为两个部分，即构建与推理。在构建环节，数据主要来源于工程师构建的故障树，也就是故障标准排查流程 SOP，以及人工坐席与用户之间的历史多轮对话信息。构建过程首先要确定变量、变量的值以及变量之间的依赖关系。从历史对话中参照故障树的知识，对排查步骤进行抽象。例如，在出现黑屏情况时，客服会让用户先排查指示灯状态，随后依据该状态进行重启或复位等操作。我们将每一通对话视为一组观测数据，基于大量此类观测数据，采用极大似然估计的方法来确定条件概率表中的参数，即寻找一组参数，使我们观测到的数据出现的概率达到最大。

在推理阶段，可通过公式从已知变量着手，计算所有未知变量的概率。这里的已知变量可以有多个，因为用户可能会提供多个现象和状态，并且随着排查的推进，已知变量的值会不断增多。相应地，相关路径上变量的概率分布也会持续更新，最终能够定位到具体的故障点或修复方案。

在实际场景中，贝叶斯网络的节点数量可能极为庞大，因此在排查过程中需要对图结构进行剪枝处理，也就是针对已排查的知识，对已知变量上下游的未知变量进行推理。当用户确定具体现象，比如无法开机或黑屏时，仅对该现象下子节点组成的所有集合节点进行推理。例如，若 A 与 D 并无关联，当 A 现象出现时，便无需排查 D 节点的情况。

在确定了底层图结构之后，我们来审视一下整体架构。

先看左边红框部分。最上方是我们刚才提及的基于贝叶斯的推理，通过与用户的多轮对话，逐步推理出接下来需要排查的步骤。在此之前，还有一个 Node mapping 操作，即将对话中已知的关键信息映射到贝叶斯网的节点上。此外，为增强大模型对标准排查流程的遵循能力，会召回历史相似对话以及 FAQ 的标准问答对，也就是历史上客服与用户的问答内容，以此进行知识补充。

这三个召回或推理操作均基于多轮对话信息得以实现，然而，多轮对话可能存在语义碎片化和信息冗余的问题。所以，我们需要进一步对对话信息进行改写，提取关键信息，去除冗余内容，将分散的语义整合为一个完整连贯的查询语句。基于此，再与知识库中的信息进行检索，这样召回的结果会更加准确。

再来看右边红框部分。鉴于在实际场景中会涉及不同设备及其对应的型号、版本等信息，并且故障排查过程与这些信息紧密相关，我们需要借助这些信息补充更多上下文，以明确具体问题。这里存在两个问题，即我们需要明确何时调用接口获取业务信息以及调用何种接口。我们通过 Tool learning 的方式来解决这一问题，让大模型自主学习何时调用以及调用何种接口。

具体来说，可以分为以下几个阶段。首先是数据微调阶段，我们需要在微调数据集里调用接口的地方添加一些标签，这样大模型就能知晓何时需要调用接口。在实际预测时，通过这些标签从上下文中提取与API相关的参数，进而请求具体接口。最终，将返回的结果信息提供给大模型用于生成回复，再将具体回复反馈给用户。这是通过 Tool learning 从外部知识库查找相关信息的一个场景。

关于图片回复，实际判断同样需要通过刚才提到的 Tool learning 方式添加一个标签，以便明确何时获取图片返回给用户。除了确定何时召回图片，我们还需明确应该返回哪些图片给用户，即需要进行图片与文本特征的对齐。具体做法是，对历史对话中的图片信息进行聚类，删除离群点，保留常用图片。基于这些图片位置的上下文信息，提取对话关键信息，构建原始图文对。接下来，基于对比学习的方式，将图片与文本映射到一个共享的向量空间，计算它们的相似度，通过对比损失优化对角线上的相似度，从而学习到它们之间的语义关系。

前文提到客服场景相对严肃，需要较高的回复准确率，因此我们要尽可能缓解大模型的幻觉问题。我们主要采用两种方式：一种是基于 RAG 和微调的方式，让大模型学到更多上下文知识；另一种是基于置信度检测的方式，若置信度较低，则重新进行推理，放弃此次回复，转为人工坐席处理该消息。在置信度检测方面，目前有两种主流技术路径，一种是白盒的方式，即获取分析模型内部的知识状态信息；另一种是黑盒的方式，通过直接判断模型的输入和输出来评估置信度。在我们的场景中，融合了这两种方式进行综合评估。一方面，利用模型输出的 logit 计算其信息熵，以此衡量模型输出概率分布的不确定性，熵越高表明分布越分散，置信度就越低；另一方面，通过多次采用不同模型的输出来评估结果的多样性，若结果高度一致，则说明多样性低，置信度相对较高，反之，多样性高则置信度低。

未来工作

介绍完这两个场景后，最后来展望一下未来的工作方向。

首先，Agentic GraphRAG 与 Graph RAG 有所不同，Graph RAG 采用较为固定的单次检索和生成方式，而 Agentic GraphRAG 强调多轮交互、动态决策和自适应推理。在刚才的教育场景中，很多应用实际上都是单次且流程固定的图检索和生成，也就是说该 GraphRAG 的 pipeline 是通过硬编码方式编排的。对于单个场景的应用，这种方式可能较为便捷，但对于相对复杂或多变的场景而言，存在一定局限性。而后面介绍的客服场景，具备多轮交互和动态推理，还引入 Tool learning 方式，让大模型学习更多使用工具的方法，以应对更为复杂的场景。基于此，我们期望构建更通用的 Agentic GraphRAG，以适用于更多场景，并解决实际落地中的各类问题。

此外，我们的大部分数据会动态变更，在知识更新时，如何保证模型的泛化能力和准确率，是极为重要的研究课题。

在多模态方面，目前还存在不足，尚未覆盖视频和音频场景，在图片场景方面也有很大的提升空间。

最后是对更多场景的探索，我们希望基于故障数据，反向辅助优化教育产品设计，从而创造更多价值。构建一个从产品到产品故障，再到产品设计的完整闭环。

以上就是本次分享的全部内容。下图中提供了 CVTE DM 团队的公众号，以及 Apache HugeGragh-AI 的开源地址，感兴趣的朋友可以关注。

问答环节

Q1：针对分享中的场景，如果不采用 GraphRAG，直接运用贝叶斯网络，或者沿用之前的知识图谱（KG），是否也能够达成同样的目标？

A1：贝叶斯网络和传统知识图谱确实可以解决部分问题，但难以实现 GraphRAG 的全部功能，GraphRAG 的独特价值在于将图结构的关系推理与LLM的文本生成相结合，使系统能够利用图结构进行深度关系推理，并通过 LLM 将结构化知识转化为自然语言，实现上下文感知的知识检索和总结。

Q2：您认为 GraphRAG 与之前的图谱关联性大吗？我们所谈及的知识图谱主要涵盖两部分：一是图谱的形，即图结构；二是图谱的魂，即实体关系、实体类型等。然而，现在很多框架，例如微软的 GraphRAG、蚂蚁的 KAG 等，呈现出一种趋势：不再抽取实体，而是直接对文本块进行检索增强生成操作。您认为这种趋势正确吗？是否还值得投入大量精力在知识图谱的设计本身？

A2：GraphRAG 与传统知识图谱既有承继也有创新，GraphRAG 保留了图谱的图结构作为知识组织方式，且两者都重视实体间关系的表达和利用，但是 GraphRAG 更注重动态知识整合而非静态知识表示，将图结构用于增强检索过程，而非仅作为查询终点。

关于"不再抽取实体"的趋势，我认为这还是得区分场景，在文档场景，块检索方式更高效、成本更低；在关系密集型场景，比如需要精确推理和可解释性，实体抽取和结构化表示仍具明显优势，例如在我们的场景中，学生的做题记录、知识点之间关系就不能通过 chunk 方式处理。理想方案应是混合架构，根据数据特性和应用需求灵活应用两种方法。

Q3：分享中提到了一些关于 GNN 的内容，您认为 GraphRAG 在后续发展中，除了 GNN 和多模态之外，发展趋势是怎么样的，还有哪些技术点值得关注？

A3：我在此分享的实际上是较为广义的 GraphRAG 概念，涉及图的多方面技术。我认为 GraphRAG 的发展可以从多方面拓展，基于图的相关技术进行各种延伸。只要对落地应用场景有帮助，GraphRAG 涉及的图技术可以是多样的，例如时序图学习，捕获知识演变和动态关系，特别适用于不断更新的知识库；可解释性图检索，通过图谱增强思维链的方式，增强检索过程的透明度，提供决策证据链等等。

Q4：什么样的任务适合选择 GraphRAG，它又不适合哪些任务，存在哪些陷阱？

A4：我认为首先要从底层数据入手，判断数据是否适合构建成图结构，并且基于场景来看，比如多跳的复杂推理、涉及实体复杂关联关系的查询等等就较为适合，而对于简单的事实查询或者数据高度独立、关系稀疏的场景就不太适合 GraphRAG。在 GraphRAG 实际实施的过程中，图结构的定义、知识的更新、以及效果的评估都是重要且容易出错的，要加强关注。另一方面，由于 GraphRAG 成本较高，可以先选取一小部分数据进行快速验证，观察在该场景下是否适用。若不适用，应及时转向其他方法。

53AI，企业落地大模型首选服务商

产品：场景落地咨询+大模型应用平台+行业解决方案

承诺：免费POC验证，效果达标后再合作。零风险落地应用大模型，已交付160+中大型企业