支持私有化部署
AI知识库

53AI知识库

学习大模型的前沿技术与行业应用场景


EraRAG:突破传统GraphRAG限制,实现动态语料库的高效检索增强生成

发布日期:2025-06-30 12:43:00 浏览次数: 1538
作者:知识图谱科技

微信搜一搜,关注“知识图谱科技”

推荐语

EraRAG突破传统GraphRAG限制,实现动态语料库的高效更新与检索,为RAG系统带来革命性提升。

核心内容:
1. EraRAG的多层图构建框架与LSH技术应用
2. 高效增量更新机制的设计与实现
3. 大规模基准测试中的性能优势与实验结果

杨芳贤
53AI创始人/腾讯云(TVP)最具价值专家
摘要
基于图的检索增强生成(图RAG)通过对外部语料库进行结构化检索来增强大型语言模型(LLMs)。然而,现有方法通常假设一个静态语料库,每当有新文档到来时都需要昂贵的全图重建,这限制了它们在动态、演变环境中的可扩展性。为了解决这些限制,我们引入了EraRAG,一种新颖的多层图RAG框架,支持高效且可扩展的动态更新。我们的方法利用基于超平面的局部敏感哈希(LSH)来划分并组织原始语料库为层次图结构,使新数据的插入能够高效且局部化,而不会破坏现有的拓扑结构。该设计消除了重新训练或昂贵重新计算的需求,同时保持了高检索准确性和低延迟。在大规模基准测试上的实验表明,与现有的图RAG系统相比,EraRag在更新时间和标记消耗上实现了数量级的减少,同时提供了更优的准确性表现。这项研究为必须操作不断增长的语料库的RAG系统提供了一个切实可行的未来方向,弥合了检索效率与适应性之间的差距。我们的代码和数据可在https://github.com/EverM0re/EraRAG-Official获取

https://arxiv.org/pdf/2506.20963

核心速览

研究背景

  1. 研究问题
    :这篇文章要解决的问题是如何在动态、不断增长的语料库上进行高效的检索增强生成(RAG)。现有的基于图的RAG方法在处理新文档时通常需要重建整个图,这在动态环境中限制了它们的可扩展性。
  2. 研究难点
    :该问题的研究难点包括:在动态语料库中,每次新文档到来时都需要重新构建整个图,导致计算开销巨大;现有方法在高频数据变化下的动态更新效率低。
  3. 相关工作
    :该问题的研究相关工作有:传统的RAG方法、基于图的RAG方法、局部敏感哈希(LSH)在高维数据索引中的应用、以及动态检索机制。

研究方法

这篇论文提出了EraRAG,一种多层图构建框架,通过结合超平面基于的局部敏感哈希(LSH)来实现高效的增量图更新。具体来说,

  1. LSH-based图构建框架:EraRAG通过递归的LSH分段和总结来构建多层图。每个向量被投影到n个随机采样的超平面上,并编码为一个n位二进制哈希码。具有相似哈希值的向量被分组到同一个桶中。通过第二阶段的划分,生成最终的分段。


  2. 高效增量图更新机制:EraRAG通过结合超平面基于的LSH和可控的分区策略来实现快速的局部更新。新加入的块被编码成向量嵌入,插入到相应的桶中,并进行向上的传播调整,仅限于受影响的段落,而不改变无关部分。

  3. 查询处理:EraRAG采用折叠图搜索策略,在接收到查询后,首先将其编码成一个嵌入向量,然后在预定义的令牌预算下从向量数据库中检索最相似的节点嵌入,并将检索到的块连接成一个上下文传递给语言模型生成最终响应。

实验设计

  1. 数据集
    :实验在五个真实世界的问题回答数据集上进行评估,包括PopQA、MultiHopQA、HotpotQA、MuSiQue和QuALITY。
  2. 基线
    :评估EraRAG与三类基线方法的性能:仅推理的方法(ZeroShot和Chain-of-Thought)、仅检索的方法(BM25和Vanilla RAG)、以及基于图的RAG方法(GraphRAG、HippoRAG、APTOR和LightRAG)。
  3. 指标
    :使用准确率和召回率作为性能指标。对于QuALITY数据集,由于没有提供详尽的参考答案,只使用准确率作为评估指标。
  4. 实现细节
    :使用Llama-3.1-8B-Instruct-Turbo作为默认的语言模型,BGE-M3作为文本表示模型,所有方法在一个统一的框架内实现。

结果与分析

  1. 静态QA性能:EraRAG在大多数情况下均优于所有基线方法,特别是在QuALITY数据集上,EraRAG的准确率比RAPTOR提高了4.8%。


  2. 动态插入消耗:EraRAG在HotpotQA、PopQA和QuALITY数据集上的动态更新效率和令牌消耗均最低。与RAPTOR相比,EraRAG在PopQA数据集上减少了高达57.6%的令牌使用,在QuALITY数据集上减少了77.5%的图重建时间。

  3. 增量性能评估:每次增量更新都逐步提高了检索质量,最终检索性能接近完全重建图的静态上限,验证了EraRAG的选择性重建机制的鲁棒性。

  4. 小规模增量插入效率分析:在小规模增量插入实验中,EraRAG的更新时间和令牌消耗显著低于基线方法,特别是在多跳推理数据集MultihopRAG上,EraRAG的更新时间比GraphRAG减少了两个数量级。

  5. 抽象QA性能:EraRAG在计算机科学、法律和混合知识领域的抽象数据集UltraDomain上,以及在多跳推理数据集MultihopRAG的抽象总结问题上,均表现出色,优于GraphRAG和RAPTOR。

  6. 初始图覆盖率对检索性能的影响:初始图覆盖率在50%-70%之间时,检索性能最佳,确认了初始结构对最终检索图质量的持久影响。


  7. 分段大小对结构权衡的影响:适当的分段大小有助于平衡效率和检索质量,过大或过小的分段都会影响性能。


  8. 不同骨干语言模型的鲁棒性:EraRAG在不同骨干语言模型(如GPT3.5 turbo和GPT4-o-mini)上保持稳定的性能,所有指标波动在10%以内。

  9. 查询类型处理效果:EraRAG能够有效处理详细查询和总结查询,确保在增量更新过程中不引入幻觉。


  10. 块大小对检索准确性和图构建效率的影响:块大小对检索质量影响有限,但适当的选择可以优化效率。


总体结论

这篇论文提出了EraRAG,一种可扩展且高效的基于图的检索增强生成框架,能够在动态语料库更新时无需完全重建。通过结合超平面基于的局部敏感哈希和选择性重聚类,EraRAG实现了增量图构建,同时保持了先前建立结构的语义完整性。广泛的实验表明,EraRAG在准确性和召回率上均优于现有的RAG基线,并且在更新过程中显著减少了令牌消耗和图构建时间。

论文评价

优点与创新

  1. EraRAG框架
    :提出了一个基于超平面的局部敏感哈希(LSH)的多层次图构建框架,通过递归的LSH分段和总结来构建多层图结构。
  2. 高效增量图更新机制
    :结合了超平面基础的LSH和可控的分区策略,支持快速且局部的更新,避免了全局重计算。
  3. 实验验证
    :在大规模基准测试中,EraRAG在更新时间和令牌消耗方面相比现有Graph-RAG系统减少了数量级,同时在准确性性能上表现优越。
  4. 选择性重构和总结
    :引入了选择性重构和总结机制,确保在动态语料库更新时仅对受影响的局部区域进行修改,保持图的完整性。
  5. 灵活的查询处理
    :采用了折叠图搜索策略,能够在查询时灵活地处理不同粒度的信息,并支持自适应的详细/总结检索策略。

不足与反思

  1. 初始图覆盖度的影响
    :虽然EraRAG通过选择性重构实现了动态语料库扩展,但最终检索图的质量可能仍然依赖于初始图覆盖度。稀疏初始化可能导致结构噪声或语义表示不佳,影响后续插入的效果。
  2. 分段大小的影响
    :分段大小对检索准确性和图构建效率的影响需要进一步研究。较小的分段可以改善RAG准确性,但会增加计算成本;较大的分段可能会增加构建时间。
  3. 模型鲁棒性
    :尽管EraRAG在不同骨干语言模型上表现出稳定的性能,但在某些情况下(如GPT3.5 turbo),召回率有所下降,可能需要进一步优化。
  4. 查询类型处理
    :虽然EraRAG能够有效处理详细查询和总结查询,但在实际应用中可能需要进一步优化以适应不同类型的查询需求。

关键问题及回答

问题1:EraRAG是如何利用超平面基于的局部敏感哈希(LSH)来实现高效的增量图更新的?

EraRAG通过结合超平面基于的局部敏感哈希(LSH)和可控的分区策略来实现快速的局部更新。具体步骤如下:

  1. LSH分段
    :首先,将输入语料库分割成文本块,并将这些块编码为向量嵌入。然后,将这些向量投影到n个随机采样的超平面上,并编码为一个n位二进制哈希码。具有相似哈希值的向量被分组到同一个桶中。
  2. 分区调整
    :通过第二阶段的划分,生成最终的分段。每个分段的大小受到用户定义的上下限控制。较小的桶会与相邻的桶合并,而较大的桶会被分割。
  3. 局部更新
    :当新语料库条目到达时,新块被编码成向量嵌入,插入到相应的桶中,并进行向上的传播调整,仅限于受影响的段落,而不改变无关部分。这种局部更新策略避免了全局重构,显著提高了效率。

问题2:EraRAG在处理动态语料库时的性能如何,与其他方法相比有何优势?

EraRAG在处理动态语料库时表现出显著的优势:

  1. 高效的增量更新
    :EraRAG通过局部敏感哈希和选择性重聚类,实现了快速的局部更新,避免了全局重构。与现有的Graph-RAG系统相比,EraRAG在更新时间和令牌消耗上减少了高达77.5%(在QuALITY数据集上)。
  2. 保持高检索准确性
    :EraRAG的设计保留了局部和全局语义关系,确保了准确的检索。实验结果表明,EraRAG在多个QA基准测试中均优于现有的RAG基线方法,特别是在QuALITY数据集上,准确率比RAPTOR提高了4.8%。
  3. 适用于大规模和细粒度的增量更新
    :EraRAG不仅在大规模数据上表现出色,还能有效处理细粒度的增量更新。在小规模增量插入实验中,EraRAG的更新时间和令牌消耗显著低于基线方法,特别是在多跳推理数据集MultihopRAG上,更新时间比GraphRAG减少了两个数量级。

问题3:EraRAG在查询处理阶段采用了什么策略,如何平衡详细信息和高层次语义信息?

EraRAG在查询处理阶段采用了折叠图搜索策略,平衡详细信息和高层次语义信息的策略如下:

  1. 折叠图搜索
    :在接收到查询后,首先将其编码成一个嵌入向量,然后在预定义的令牌预算下从向量数据库中检索最相似的节点嵌入。将所有检索到的块连接成一个上下文,传递给语言模型生成最终响应。
  2. 自适应检索策略
    :为了更好地适应不同类型的查询,EraRAG引入了两种检索模式:
  • 详细搜索
    :对于需要详细信息的查询,优先从叶层检索块。首先进行叶层的前k个检索,然后在总结层进行后续的检索,以确保保留足够的上下文抽象。
  • 总结搜索
    :对于需要高层次语义信息的查询,优先从总结层检索块。首先进行总结层的前k个检索,然后在叶层进行后续的检索,以补充关键的事实信息。
    通过这种自适应检索策略,EraRAG能够灵活地处理从详细事实到高层次总结的各种查询类型。

53AI,企业落地大模型首选服务商

产品:场景落地咨询+大模型应用平台+行业解决方案

承诺:免费场景POC验证,效果验证后签署服务协议。零风险落地应用大模型,已交付160+中大型企业

联系我们

售前咨询
186 6662 7370
预约演示
185 8882 0121

微信扫码

添加专属顾问

回到顶部

加载中...

扫码咨询