我要投稿

GraphRAG的索引动态更新解法-分桶+局部更新及“上下文工程”新概念？

发布日期：2025-06-30 10:37:33 浏览次数： 2125

作者：老刘说NLP

微信搜一搜，关注“老刘说NLP”

今天是2025年6月30日，星期一，北京，晴，今天是2025年上半年的最后一天了。

我们继续看GraphRAG的问题，基于图的检索增强生成（Graph-RAG）在处理动态增长语料库时的效率问题。

现在的一些方案，主要集中在静态语料库的检索增强生成，如Vanilla RAG、Graph-based RAG等。动态检索方法如DRAGIN、LightRAG和DyPRAG等虽然尝试解决动态语料库的问题，但在高频数据变化下的动态更新消耗仍然较高。

这个问题的难点在于如何在不需要全图重建的情况下，高效地更新语料库，并保持高检索准确性和低延迟。

所以，问题来了，既然需要动不动就重新构图，那么是否可以去个重，分个桶，然后把新更新的，归类到某个桶中，然后再根据这个桶所属的层级中，做局部更新？

这也就一种动全部，不如拉相似度分桶动局部的思路，那就会用到聚类，去重这些，所以，我们来看看一个具体的实现思路，很简单。

另外，最近也在继续造新词，还是需要新故事维持热度，继续换概念，值得就是这个上下文工程（context engineering），来看看是个啥？

一、LSH局部敏感哈希+RAPTOR动态更新的GraphRAG思路-EraRAG

顺着上面的思路，看最近的一个工作，EraRAG: Efficient and Incremental Retrieval Augmented Generation for Growing Corpora，https://arxiv.org/pdf/2506.20963，实现的代码在：https://github.com/EverM0re/EraRAG-Official

其实现思路很简单，利用基于超平面的局部敏感哈希（LSH）将原始语料库分区和组织成层次化的图结构，通过将相似项映射到相同的桶中，实现高效的分组。通过递归的LSH分割和总结，构建了一个多层次的图结构，当新语料条目到达时，EraRAG通过将新块编码为向量嵌入，并将其插入到适当的桶中，进行向上传播的调整，这些调整仅限于受影响的部分，而不会改变图的其他部分。

进一步的拆分开来，核心步骤就几个：

1、LSH-based图构建

LSH局部敏感哈希，是常见的相似度方案，利用哈希将相似项映射到同一桶中。

1）LSH分段

在这个方案中，给定输入语料库后，首先将其处理为文本块，然后将它们编码为向量嵌入。然后，将这些向量投影到n个随机采样的超平面上，并编码为一个n位二进制哈希码。具有相似哈希值的向量被分组到同一个桶中。

2）分段调整

每个分段的大小受到用户定义的上下限控制。较小的桶会与相邻的桶合并，而较大的桶会被分割。对于每个生成的分段，使用LLM将其包含的文本块总结为一个新的块。

3）构建层次图

递归调用哈希、分段和总结这个过程，采用RAPTOR方案，构建多层次的图结构。

4）局部更新

当新语料库条目到达时，新块被编码成向量嵌入，插入到相应的桶中，并进行向上的传播调整，仅限于受影响的部分，而不改变无关部分。

所以说，这个想法很自然，动全部，不如拉相似度分桶动局部，结果也很直接，例如，在HotpotQA数据集上，EraRAG相比RAPTOR减少了高达77.5%的图重建时间。

但是，这种方法也存在一些问题，这个很依赖于分桶的质量，以及初始形成的图结构。适当的分段大小有助于平衡效率和检索质量，过大或过小的分段都会影响性能。

二、继续造词包装-“上下文工程”概念

也是昨天，看到一个新词，叫“上下文工程”，来自https://blog.langchain.com/the-rise-of-context-engineering/，有人调侃到，提示工程又换个说法，下一个名字我已想好，“语义态势感知管理”，缩写LSDM。

从这张图上，可以很直接的看到“上下文工程”是个啥，就是把RAG、提示词工程、记忆、历史记录这些包成了一个整体的新词。

用这个blog的话来说，上下文工程就是构建动态系统，以提供正确格式的信息和工具，使大型语言模型（LLM）能够合理地完成任务。

大多数情况下，当代理（Agent）不可靠地执行任务时，根本原因是没有将适当的上下文、指令和工具传达给模型（这是个废话，因为现在大模型做应用，prompt是媒介。）

MCP\ACP这些也不火了，Agent继续炒，就要新的名词，新的概念，这样，才有新的故事，但这并不好，并没有新的东西产生，反而加重了认知负担。

53AI，企业落地大模型首选服务商

产品：场景落地咨询+大模型应用平台+行业解决方案

承诺：免费POC验证，效果达标后再合作。零风险落地应用大模型，已交付160+中大型企业

相关资讯

2026-02-21

Claude Code 每次都要重新探索代码？这个工具直接省下30%成本

2026-02-18

函数计算 AgentRun 重磅上线知识库功能，赋能智能体更“懂”你

2026-02-15

当RAG遇上Agent记忆：为什么相似度检索会"塌方"？

2026-02-15

查个问题还要全图跑一遍？DA-RAG说我只取一瓢

2026-02-14

OpenClaw 终于能"记住"事了！我花了 3 周折腾出的长期记忆系统

2026-02-13

深度解析 PageIndex：无向量 RAG 框架的技术实现与原理剖析

2026-02-12

走进 OceanBase 向量背后的算法库 —— VSAG

2026-02-11

开源：我们复刻了OpenClaw的mem系统，为所有Agent打造透明、可控的记忆

联系获取

联系获取

160+中大型企业正在使用53AI

立即咨询预约演示

把握AI发展的机遇，共同探索、共同进步

2025-01-22

如何打造基于GenAI的员工服务机器人

2025-01-22

热点资讯

RAG 深度解读：检索增强生成如何改变人工智能

2025-12-04

大模型RAG入门宝典｜从AI搜索到实战搭建，小白&程序员必收藏的检索增强指南

2025-12-03

2026 年你需要了解的 RAG 全解析

2026-01-15

企业级 AI Agent规模化落地的避坑指南，就藏在这四大趋势里

2025-12-02

如何用NotebookLM，把枯燥的财报解读成精美的PPT？

2026-01-02

为什么Claude Code不用RAG？

2025-12-23

Embedding模型选型思路：相似度高不再代表检索准确（文末附实战指南）

2025-12-07

从 RAG 到 Context：2025 年 RAG 技术年终总结

2025-12-18

告别向量数据库！PageIndex：让AI像人类专家一样阅读长文档

2026-02-03

开源：我们复刻了OpenClaw的mem系统，为所有Agent打造透明、可控的记忆

2026-02-11

大家都在问

当RAG遇上Agent记忆：为什么相似度检索会"塌方"？

2026-02-15

Claude Cowork 真能替换 RAG ？

2026-02-04

使用 Agent Skills 做知识库检索，能比传统 RAG 效果更好吗？

2026-02-03

为什么 RAG 越用越慢？如何反向调优？

2026-01-19

NotebookLM如何在48小时内分析2万份论文？

2026-01-12

都有混合检索与智能路由了，谁还在给RAG赛博哭坟？

2026-01-08

如何用NotebookLM，把枯燥的财报解读成精美的PPT？

2026-01-02

为什么Claude Code不用RAG？

2025-12-23

热门标签

内容创作大模型技术个人提效 langchain llamaindex 多模态技术 RAG技术智能客服知识图谱模型微调 RAGFlow coze Dify Fastgpt Bisheng Qanything AI+汽车 AI+金融 AI+工业 AI+培训 AI+SaaS 提示词框架提示词技巧 AI+电商 AI面试数字员工 ChatBI AI知识库开源大模型智能营销智能硬件智能化改造 AI+医疗 MaxKB Palantir Glean

应聘简历请发送至： ceo@53ai.com

联系我们

售前咨询

预约演示

微信扫码

添加专属顾问

回到顶部