我要投稿

这次，RAG记忆被微信AI团队的超图盘活了

发布日期：2026-01-01 20:46:23 浏览次数： 1865

作者：PaperToday

微信搜一搜，关注“PaperToday”

https://github.com/Encyclomen/HGMem
Improving Multi-Step RAG with Hypergraph-Based Memory for Long-Context Complex Relational Modeling  
https://arxiv.org/pdf/2512.23959

港中大 & WeChat AI 联合团队

RAG双重暴击:“超长+全局推理”

传统 RAG 的痛点	具体表现
单步检索	只能“点到点”找答案，跨章节、跨事件关联无力
工作记忆=简单摘要	用一段流水账 plain text 记录历史，丢细节、丢引用、丢结构
图记忆	最多二元关系（A→B），无法表达“三元及以上”高阶关联

结果：在 100k+ token 的金融/法律/小说类文档里，一旦问题需要“全局 sense-making”（例如“为什么 Xodar 被送给 Carter 当奴隶？”），现有方法就像拼图只拼边缘，中间永远缺一块。

HGMEM——把“记忆”升级成“超图”

图1：左侧为第 t 步交互流程；右侧为超图记忆的演化示意

2.1 核心思想

把“工作记忆”不再当成一块硬盘，而是一张可动态生长、可高阶连接的超图：

每个超边（hyperedge）= 一个“记忆点”，可一次性连接 ≥2 个实体
支持三种原子操作：Update ∣ Insert ∣ Merge
每一步先“自我检查”→ 决定局部深挖 or 全局探索 → 检索 → 用 LLM 把新证据合并成更高阶的超边

2.2 关键模块一览

模块	作用	与传统做法差异
超图存储	用 `hypergraph-db` 实时维护节点 & 超边	不再是 plain text 或二元图
自适应检索	Local Investigation ↔ Global Exploration 切换	先“查周边”再“开新地图”，减少冗余
记忆合并	把多条低阶事实熔成一条高阶关系	二元图做不到 n-ary 融合
子查询生成	LLM 基于当前超图拓扑自动出题	避免人工模板

图2 记忆演化案例

图2：Cowslip Moth 案例中，三条低阶事实被合并成一条“昆虫-植物共生”高阶关系

实验：成绩与成本双赢

3.1 主要结果

在 4 个超长文档基准（NarrativeQA / NoCha / Prelude / LongBench-V2）上，同样用 GPT-4o 或 Qwen-32B 做 backbone，HGMEM 全线 SOTA：

表1：↑ 表示合并操作带来的高阶关联对“sense-making”类问题尤为关键

3.2 成本对比

与同样带工作记忆的 DeepRAG / ComoRAG 相比，HGMEM 平均 token 消耗与延迟几乎持平，并未因“超图”而额外增负：

表5 在线开销对比

表5：合并操作仅增加 <7% token，却带来显著精度提升

一句话总结

HGMEM 把“记忆”从静态硬盘升级成动态超图，让大模型在超长文本里像侦探一样层层抽丝、合并线索、全局破案，而且不增成本——多步 RAG 的“记忆”就该这么玩！

53AI，企业落地大模型首选服务商

产品：场景落地咨询+大模型应用平台+行业解决方案

承诺：免费POC验证，效果达标后再合作。零风险落地应用大模型，已交付160+中大型企业

相关资讯

2026-02-15

当RAG遇上Agent记忆：为什么相似度检索会"塌方"？

2026-02-15

查个问题还要全图跑一遍？DA-RAG说我只取一瓢

2026-02-14

OpenClaw 终于能"记住"事了！我花了 3 周折腾出的长期记忆系统

2026-02-13

深度解析 PageIndex：无向量 RAG 框架的技术实现与原理剖析

2026-02-12

走进 OceanBase 向量背后的算法库 —— VSAG

2026-02-11

开源：我们复刻了OpenClaw的mem系统，为所有Agent打造透明、可控的记忆

2026-02-10

Data Agent Ready Database：下一代企业数仓架构

2026-02-10

丢掉向量数据库！PageIndex 开启“推理型 RAG”新时代，长文档分析准确率高达 98.7%

联系获取

联系获取

160+中大型企业正在使用53AI

立即咨询预约演示

把握AI发展的机遇，共同探索、共同进步

2025-01-22

如何打造基于GenAI的员工服务机器人

2025-01-22

热点资讯

RAG 深度解读：检索增强生成如何改变人工智能

2025-12-04

大模型RAG入门宝典｜从AI搜索到实战搭建，小白&程序员必收藏的检索增强指南

2025-12-03

企业级 AI Agent规模化落地的避坑指南，就藏在这四大趋势里

2025-12-02

2026 年你需要了解的 RAG 全解析

2026-01-15

为什么Claude Code不用RAG？

2025-12-23

如何用NotebookLM，把枯燥的财报解读成精美的PPT？

2026-01-02

Embedding模型选型思路：相似度高不再代表检索准确（文末附实战指南）

2025-12-07

从 RAG 到 Context：2025 年 RAG 技术年终总结

2025-12-18

告别向量数据库！PageIndex：让AI像人类专家一样阅读长文档

2026-02-03

RAG知识库迎来大洗牌：GraphRAG如何让机器真正读懂世界？

2025-11-23

大家都在问

当RAG遇上Agent记忆：为什么相似度检索会"塌方"？

2026-02-15

Claude Cowork 真能替换 RAG ？

2026-02-04

使用 Agent Skills 做知识库检索，能比传统 RAG 效果更好吗？

2026-02-03

为什么 RAG 越用越慢？如何反向调优？

2026-01-19

NotebookLM如何在48小时内分析2万份论文？

2026-01-12

都有混合检索与智能路由了，谁还在给RAG赛博哭坟？

2026-01-08

如何用NotebookLM，把枯燥的财报解读成精美的PPT？

2026-01-02

为什么Claude Code不用RAG？

2025-12-23

热门标签

内容创作大模型技术个人提效 langchain llamaindex 多模态技术 RAG技术智能客服知识图谱模型微调 RAGFlow coze Dify Fastgpt Bisheng Qanything AI+汽车 AI+金融 AI+工业 AI+培训 AI+SaaS 提示词框架提示词技巧 AI+电商 AI面试数字员工 ChatBI AI知识库开源大模型智能营销智能硬件智能化改造 AI+医疗 MaxKB Palantir Glean

应聘简历请发送至： ceo@53ai.com

联系我们

售前咨询

预约演示

微信扫码

添加专属顾问

回到顶部