微信扫码
添加专属顾问
我要投稿
EraRAG突破传统GraphRAG限制,实现动态语料库的高效更新与检索,为RAG系统带来革命性提升。 核心内容: 1. EraRAG的多层图构建框架与LSH技术应用 2. 高效增量更新机制的设计与实现 3. 大规模基准测试中的性能优势与实验结果
https://arxiv.org/pdf/2506.20963
这篇论文提出了EraRAG,一种多层图构建框架,通过结合超平面基于的局部敏感哈希(LSH)来实现高效的增量图更新。具体来说,
LSH-based图构建框架:EraRAG通过递归的LSH分段和总结来构建多层图。每个向量被投影到n个随机采样的超平面上,并编码为一个n位二进制哈希码。具有相似哈希值的向量被分组到同一个桶中。通过第二阶段的划分,生成最终的分段。
高效增量图更新机制:EraRAG通过结合超平面基于的LSH和可控的分区策略来实现快速的局部更新。新加入的块被编码成向量嵌入,插入到相应的桶中,并进行向上的传播调整,仅限于受影响的段落,而不改变无关部分。
查询处理:EraRAG采用折叠图搜索策略,在接收到查询后,首先将其编码成一个嵌入向量,然后在预定义的令牌预算下从向量数据库中检索最相似的节点嵌入,并将检索到的块连接成一个上下文传递给语言模型生成最终响应。
静态QA性能:EraRAG在大多数情况下均优于所有基线方法,特别是在QuALITY数据集上,EraRAG的准确率比RAPTOR提高了4.8%。
动态插入消耗:EraRAG在HotpotQA、PopQA和QuALITY数据集上的动态更新效率和令牌消耗均最低。与RAPTOR相比,EraRAG在PopQA数据集上减少了高达57.6%的令牌使用,在QuALITY数据集上减少了77.5%的图重建时间。
增量性能评估:每次增量更新都逐步提高了检索质量,最终检索性能接近完全重建图的静态上限,验证了EraRAG的选择性重建机制的鲁棒性。
小规模增量插入效率分析:在小规模增量插入实验中,EraRAG的更新时间和令牌消耗显著低于基线方法,特别是在多跳推理数据集MultihopRAG上,EraRAG的更新时间比GraphRAG减少了两个数量级。
抽象QA性能:EraRAG在计算机科学、法律和混合知识领域的抽象数据集UltraDomain上,以及在多跳推理数据集MultihopRAG的抽象总结问题上,均表现出色,优于GraphRAG和RAPTOR。
初始图覆盖率对检索性能的影响:初始图覆盖率在50%-70%之间时,检索性能最佳,确认了初始结构对最终检索图质量的持久影响。
分段大小对结构权衡的影响:适当的分段大小有助于平衡效率和检索质量,过大或过小的分段都会影响性能。
不同骨干语言模型的鲁棒性:EraRAG在不同骨干语言模型(如GPT3.5 turbo和GPT4-o-mini)上保持稳定的性能,所有指标波动在10%以内。
查询类型处理效果:EraRAG能够有效处理详细查询和总结查询,确保在增量更新过程中不引入幻觉。
块大小对检索准确性和图构建效率的影响:块大小对检索质量影响有限,但适当的选择可以优化效率。
这篇论文提出了EraRAG,一种可扩展且高效的基于图的检索增强生成框架,能够在动态语料库更新时无需完全重建。通过结合超平面基于的局部敏感哈希和选择性重聚类,EraRAG实现了增量图构建,同时保持了先前建立结构的语义完整性。广泛的实验表明,EraRAG在准确性和召回率上均优于现有的RAG基线,并且在更新过程中显著减少了令牌消耗和图构建时间。
论文评价
问题1:EraRAG是如何利用超平面基于的局部敏感哈希(LSH)来实现高效的增量图更新的?
EraRAG通过结合超平面基于的局部敏感哈希(LSH)和可控的分区策略来实现快速的局部更新。具体步骤如下:
问题2:EraRAG在处理动态语料库时的性能如何,与其他方法相比有何优势?
EraRAG在处理动态语料库时表现出显著的优势:
问题3:EraRAG在查询处理阶段采用了什么策略,如何平衡详细信息和高层次语义信息?
EraRAG在查询处理阶段采用了折叠图搜索策略,平衡详细信息和高层次语义信息的策略如下:
53AI,企业落地大模型首选服务商
产品:场景落地咨询+大模型应用平台+行业解决方案
承诺:免费POC验证,效果达标后再合作。零风险落地应用大模型,已交付160+中大型企业
2025-08-14
RAG实践技巧:将向量库降级为“语义路由器”,让答案更合理
2025-08-14
别只顾着卷检索了!真正决定RAG上限的,是这四个“后处理”工程
2025-08-14
RAG 入门指南:LlamaIndex、GraphRAG、 RAGFlow 学习建议与技术选型
2025-08-14
Spring AI 高级 RAG 优化指南:文档预处理提升检索精度与召回率
2025-08-13
一文了解Ragflow知识库优化检索的方法
2025-08-13
再看表格RAG 怎么做?及大模型问数开源项目SQLBot实现解析
2025-08-13
大模型增强检索优化之——用智能体去重构你的RAG系统
2025-08-13
大模型RAG实战|基于ThinkDoc文档解析与融合检索能力,提升RAG效果
2025-05-30
2025-06-05
2025-06-06
2025-05-19
2025-06-05
2025-05-20
2025-05-27
2025-06-05
2025-05-19
2025-06-20
2025-08-11
2025-08-05
2025-07-28
2025-07-09
2025-07-04
2025-07-01
2025-07-01
2025-07-01