微信扫码
添加专属顾问
我要投稿
EraRAG突破传统GraphRAG限制,实现动态语料库的高效更新与检索,为RAG系统带来革命性提升。 核心内容: 1. EraRAG的多层图构建框架与LSH技术应用 2. 高效增量更新机制的设计与实现 3. 大规模基准测试中的性能优势与实验结果
https://arxiv.org/pdf/2506.20963
这篇论文提出了EraRAG,一种多层图构建框架,通过结合超平面基于的局部敏感哈希(LSH)来实现高效的增量图更新。具体来说,
LSH-based图构建框架:EraRAG通过递归的LSH分段和总结来构建多层图。每个向量被投影到n个随机采样的超平面上,并编码为一个n位二进制哈希码。具有相似哈希值的向量被分组到同一个桶中。通过第二阶段的划分,生成最终的分段。
高效增量图更新机制:EraRAG通过结合超平面基于的LSH和可控的分区策略来实现快速的局部更新。新加入的块被编码成向量嵌入,插入到相应的桶中,并进行向上的传播调整,仅限于受影响的段落,而不改变无关部分。
查询处理:EraRAG采用折叠图搜索策略,在接收到查询后,首先将其编码成一个嵌入向量,然后在预定义的令牌预算下从向量数据库中检索最相似的节点嵌入,并将检索到的块连接成一个上下文传递给语言模型生成最终响应。
静态QA性能:EraRAG在大多数情况下均优于所有基线方法,特别是在QuALITY数据集上,EraRAG的准确率比RAPTOR提高了4.8%。
动态插入消耗:EraRAG在HotpotQA、PopQA和QuALITY数据集上的动态更新效率和令牌消耗均最低。与RAPTOR相比,EraRAG在PopQA数据集上减少了高达57.6%的令牌使用,在QuALITY数据集上减少了77.5%的图重建时间。
增量性能评估:每次增量更新都逐步提高了检索质量,最终检索性能接近完全重建图的静态上限,验证了EraRAG的选择性重建机制的鲁棒性。
小规模增量插入效率分析:在小规模增量插入实验中,EraRAG的更新时间和令牌消耗显著低于基线方法,特别是在多跳推理数据集MultihopRAG上,EraRAG的更新时间比GraphRAG减少了两个数量级。
抽象QA性能:EraRAG在计算机科学、法律和混合知识领域的抽象数据集UltraDomain上,以及在多跳推理数据集MultihopRAG的抽象总结问题上,均表现出色,优于GraphRAG和RAPTOR。
初始图覆盖率对检索性能的影响:初始图覆盖率在50%-70%之间时,检索性能最佳,确认了初始结构对最终检索图质量的持久影响。
分段大小对结构权衡的影响:适当的分段大小有助于平衡效率和检索质量,过大或过小的分段都会影响性能。
不同骨干语言模型的鲁棒性:EraRAG在不同骨干语言模型(如GPT3.5 turbo和GPT4-o-mini)上保持稳定的性能,所有指标波动在10%以内。
查询类型处理效果:EraRAG能够有效处理详细查询和总结查询,确保在增量更新过程中不引入幻觉。
块大小对检索准确性和图构建效率的影响:块大小对检索质量影响有限,但适当的选择可以优化效率。
这篇论文提出了EraRAG,一种可扩展且高效的基于图的检索增强生成框架,能够在动态语料库更新时无需完全重建。通过结合超平面基于的局部敏感哈希和选择性重聚类,EraRAG实现了增量图构建,同时保持了先前建立结构的语义完整性。广泛的实验表明,EraRAG在准确性和召回率上均优于现有的RAG基线,并且在更新过程中显著减少了令牌消耗和图构建时间。
论文评价
问题1:EraRAG是如何利用超平面基于的局部敏感哈希(LSH)来实现高效的增量图更新的?
EraRAG通过结合超平面基于的局部敏感哈希(LSH)和可控的分区策略来实现快速的局部更新。具体步骤如下:
问题2:EraRAG在处理动态语料库时的性能如何,与其他方法相比有何优势?
EraRAG在处理动态语料库时表现出显著的优势:
问题3:EraRAG在查询处理阶段采用了什么策略,如何平衡详细信息和高层次语义信息?
EraRAG在查询处理阶段采用了折叠图搜索策略,平衡详细信息和高层次语义信息的策略如下:
53AI,企业落地大模型首选服务商
产品:场景落地咨询+大模型应用平台+行业解决方案
承诺:免费场景POC验证,效果验证后签署服务协议。零风险落地应用大模型,已交付160+中大型企业
2025-06-30
GraphRAG的索引动态更新解法-分桶+局部更新及“上下文工程”新概念?
2025-06-30
RAG搭建个人LLM知识库助手,很多人第一步就走错了...
2025-06-29
你的RAG系统安全么?
2025-06-28
Dify+RAG合同生成:条款级工作流案例拆解
2025-06-28
RAG工程落地:处理文档中表格数据
2025-06-27
为什么你的RAGFlow需要一个 Markdown 预览器(油猴脚本方案)
2025-06-26
RAG 2.0:构建具备显式推理能力的金融RAG系统实战手册
2025-06-26
RAG(检索增强生成)入门:结合DeepSeek与知识库,让AI回答更精准!
2025-04-13
2025-04-19
2025-04-09
2025-04-16
2025-05-08
2025-04-05
2025-04-23
2025-04-08
2025-04-10
2025-04-09