EraRAG：突破传统GraphRAG限制，实现动态语料库的高效检索增强生成

发布日期：2025-06-30 12:43:00 浏览次数： 2301

作者：知识图谱科技

微信搜一搜，关注“知识图谱科技”

摘要

基于图的检索增强生成（图RAG）通过对外部语料库进行结构化检索来增强大型语言模型（LLMs）。然而，现有方法通常假设一个静态语料库，每当有新文档到来时都需要昂贵的全图重建，这限制了它们在动态、演变环境中的可扩展性。为了解决这些限制，我们引入了EraRAG，一种新颖的多层图RAG框架，支持高效且可扩展的动态更新。我们的方法利用基于超平面的局部敏感哈希（LSH）来划分并组织原始语料库为层次图结构，使新数据的插入能够高效且局部化，而不会破坏现有的拓扑结构。该设计消除了重新训练或昂贵重新计算的需求，同时保持了高检索准确性和低延迟。在大规模基准测试上的实验表明，与现有的图RAG系统相比，EraRag在更新时间和标记消耗上实现了数量级的减少，同时提供了更优的准确性表现。这项研究为必须操作不断增长的语料库的RAG系统提供了一个切实可行的未来方向，弥合了检索效率与适应性之间的差距。我们的代码和数据可在https://github.com/EverM0re/EraRAG-Official获取。

https://arxiv.org/pdf/2506.20963

核心速览

研究背景

研究问题
：这篇文章要解决的问题是如何在动态、不断增长的语料库上进行高效的检索增强生成（RAG）。现有的基于图的RAG方法在处理新文档时通常需要重建整个图，这在动态环境中限制了它们的可扩展性。
研究难点
：该问题的研究难点包括：在动态语料库中，每次新文档到来时都需要重新构建整个图，导致计算开销巨大；现有方法在高频数据变化下的动态更新效率低。
相关工作
：该问题的研究相关工作有：传统的RAG方法、基于图的RAG方法、局部敏感哈希（LSH）在高维数据索引中的应用、以及动态检索机制。

研究方法

这篇论文提出了EraRAG，一种多层图构建框架，通过结合超平面基于的局部敏感哈希（LSH）来实现高效的增量图更新。具体来说，

LSH-based图构建框架：EraRAG通过递归的LSH分段和总结来构建多层图。每个向量被投影到n个随机采样的超平面上，并编码为一个n位二进制哈希码。具有相似哈希值的向量被分组到同一个桶中。通过第二阶段的划分，生成最终的分段。
高效增量图更新机制：EraRAG通过结合超平面基于的LSH和可控的分区策略来实现快速的局部更新。新加入的块被编码成向量嵌入，插入到相应的桶中，并进行向上的传播调整，仅限于受影响的段落，而不改变无关部分。
查询处理：EraRAG采用折叠图搜索策略，在接收到查询后，首先将其编码成一个嵌入向量，然后在预定义的令牌预算下从向量数据库中检索最相似的节点嵌入，并将检索到的块连接成一个上下文传递给语言模型生成最终响应。

实验设计

数据集
：实验在五个真实世界的问题回答数据集上进行评估，包括PopQA、MultiHopQA、HotpotQA、MuSiQue和QuALITY。
基线
：评估EraRAG与三类基线方法的性能：仅推理的方法（ZeroShot和Chain-of-Thought）、仅检索的方法（BM25和Vanilla RAG）、以及基于图的RAG方法（GraphRAG、HippoRAG、APTOR和LightRAG）。
指标
：使用准确率和召回率作为性能指标。对于QuALITY数据集，由于没有提供详尽的参考答案，只使用准确率作为评估指标。
实现细节
：使用Llama-3.1-8B-Instruct-Turbo作为默认的语言模型，BGE-M3作为文本表示模型，所有方法在一个统一的框架内实现。

结果与分析

静态QA性能：EraRAG在大多数情况下均优于所有基线方法，特别是在QuALITY数据集上，EraRAG的准确率比RAPTOR提高了4.8%。
动态插入消耗：EraRAG在HotpotQA、PopQA和QuALITY数据集上的动态更新效率和令牌消耗均最低。与RAPTOR相比，EraRAG在PopQA数据集上减少了高达57.6%的令牌使用，在QuALITY数据集上减少了77.5%的图重建时间。
增量性能评估：每次增量更新都逐步提高了检索质量，最终检索性能接近完全重建图的静态上限，验证了EraRAG的选择性重建机制的鲁棒性。
小规模增量插入效率分析：在小规模增量插入实验中，EraRAG的更新时间和令牌消耗显著低于基线方法，特别是在多跳推理数据集MultihopRAG上，EraRAG的更新时间比GraphRAG减少了两个数量级。
抽象QA性能：EraRAG在计算机科学、法律和混合知识领域的抽象数据集UltraDomain上，以及在多跳推理数据集MultihopRAG的抽象总结问题上，均表现出色，优于GraphRAG和RAPTOR。
初始图覆盖率对检索性能的影响：初始图覆盖率在50%-70%之间时，检索性能最佳，确认了初始结构对最终检索图质量的持久影响。
分段大小对结构权衡的影响：适当的分段大小有助于平衡效率和检索质量，过大或过小的分段都会影响性能。
不同骨干语言模型的鲁棒性：EraRAG在不同骨干语言模型（如GPT3.5 turbo和GPT4-o-mini）上保持稳定的性能，所有指标波动在10%以内。
查询类型处理效果：EraRAG能够有效处理详细查询和总结查询，确保在增量更新过程中不引入幻觉。
块大小对检索准确性和图构建效率的影响：块大小对检索质量影响有限，但适当的选择可以优化效率。

总体结论

这篇论文提出了EraRAG，一种可扩展且高效的基于图的检索增强生成框架，能够在动态语料库更新时无需完全重建。通过结合超平面基于的局部敏感哈希和选择性重聚类，EraRAG实现了增量图构建，同时保持了先前建立结构的语义完整性。广泛的实验表明，EraRAG在准确性和召回率上均优于现有的RAG基线，并且在更新过程中显著减少了令牌消耗和图构建时间。

论文评价

优点与创新

EraRAG框架
：提出了一个基于超平面的局部敏感哈希（LSH）的多层次图构建框架，通过递归的LSH分段和总结来构建多层图结构。
高效增量图更新机制
：结合了超平面基础的LSH和可控的分区策略，支持快速且局部的更新，避免了全局重计算。
实验验证
：在大规模基准测试中，EraRAG在更新时间和令牌消耗方面相比现有Graph-RAG系统减少了数量级，同时在准确性性能上表现优越。
选择性重构和总结
：引入了选择性重构和总结机制，确保在动态语料库更新时仅对受影响的局部区域进行修改，保持图的完整性。
灵活的查询处理
：采用了折叠图搜索策略，能够在查询时灵活地处理不同粒度的信息，并支持自适应的详细/总结检索策略。

不足与反思

初始图覆盖度的影响
：虽然EraRAG通过选择性重构实现了动态语料库扩展，但最终检索图的质量可能仍然依赖于初始图覆盖度。稀疏初始化可能导致结构噪声或语义表示不佳，影响后续插入的效果。
分段大小的影响
：分段大小对检索准确性和图构建效率的影响需要进一步研究。较小的分段可以改善RAG准确性，但会增加计算成本；较大的分段可能会增加构建时间。
模型鲁棒性
：尽管EraRAG在不同骨干语言模型上表现出稳定的性能，但在某些情况下（如GPT3.5 turbo），召回率有所下降，可能需要进一步优化。
查询类型处理
：虽然EraRAG能够有效处理详细查询和总结查询，但在实际应用中可能需要进一步优化以适应不同类型的查询需求。

关键问题及回答

问题1：EraRAG是如何利用超平面基于的局部敏感哈希（LSH）来实现高效的增量图更新的？

EraRAG通过结合超平面基于的局部敏感哈希（LSH）和可控的分区策略来实现快速的局部更新。具体步骤如下：

LSH分段
：首先，将输入语料库分割成文本块，并将这些块编码为向量嵌入。然后，将这些向量投影到n个随机采样的超平面上，并编码为一个n位二进制哈希码。具有相似哈希值的向量被分组到同一个桶中。
分区调整
：通过第二阶段的划分，生成最终的分段。每个分段的大小受到用户定义的上下限控制。较小的桶会与相邻的桶合并，而较大的桶会被分割。
局部更新
：当新语料库条目到达时，新块被编码成向量嵌入，插入到相应的桶中，并进行向上的传播调整，仅限于受影响的段落，而不改变无关部分。这种局部更新策略避免了全局重构，显著提高了效率。

问题2：EraRAG在处理动态语料库时的性能如何，与其他方法相比有何优势？

EraRAG在处理动态语料库时表现出显著的优势：

高效的增量更新
：EraRAG通过局部敏感哈希和选择性重聚类，实现了快速的局部更新，避免了全局重构。与现有的Graph-RAG系统相比，EraRAG在更新时间和令牌消耗上减少了高达77.5%（在QuALITY数据集上）。
保持高检索准确性
：EraRAG的设计保留了局部和全局语义关系，确保了准确的检索。实验结果表明，EraRAG在多个QA基准测试中均优于现有的RAG基线方法，特别是在QuALITY数据集上，准确率比RAPTOR提高了4.8%。
适用于大规模和细粒度的增量更新
：EraRAG不仅在大规模数据上表现出色，还能有效处理细粒度的增量更新。在小规模增量插入实验中，EraRAG的更新时间和令牌消耗显著低于基线方法，特别是在多跳推理数据集MultihopRAG上，更新时间比GraphRAG减少了两个数量级。

问题3：EraRAG在查询处理阶段采用了什么策略，如何平衡详细信息和高层次语义信息？

EraRAG在查询处理阶段采用了折叠图搜索策略，平衡详细信息和高层次语义信息的策略如下：

折叠图搜索
：在接收到查询后，首先将其编码成一个嵌入向量，然后在预定义的令牌预算下从向量数据库中检索最相似的节点嵌入。将所有检索到的块连接成一个上下文，传递给语言模型生成最终响应。
自适应检索策略
：为了更好地适应不同类型的查询，EraRAG引入了两种检索模式：

详细搜索
：对于需要详细信息的查询，优先从叶层检索块。首先进行叶层的前k个检索，然后在总结层进行后续的检索，以确保保留足够的上下文抽象。
总结搜索
：对于需要高层次语义信息的查询，优先从总结层检索块。首先进行总结层的前k个检索，然后在叶层进行后续的检索，以补充关键的事实信息。
通过这种自适应检索策略，EraRAG能够灵活地处理从详细事实到高层次总结的各种查询类型。

53AI，企业落地大模型首选服务商

产品：场景落地咨询+大模型应用平台+行业解决方案

承诺：免费POC验证，效果达标后再合作。零风险落地应用大模型，已交付160+中大型企业