免费POC, 零成本试错
AI知识库

53AI知识库

学习大模型的前沿技术与行业应用场景


我要投稿

为RAG装上导航:ToPG通过图遍历,破局复杂查询

发布日期:2026-01-11 16:24:02 浏览次数: 1523
作者:PaperToday

微信搜一搜,关注“PaperToday”

推荐语

ToPG通过创新的图遍历方法,巧妙平衡信息粒度与结构灵活性,为复杂RAG查询提供高效解决方案。

核心内容:
1. 传统RAG方案的三大痛点与局限性
2. ToPG框架的异构构图与三种智能导航策略
3. 关键技术实现与多场景性能对比数据

杨芳贤
53AI创始人/腾讯云(TVP)最具价值专家
https://github.com/idiap/ToPG
https://arxiv.org/pdf/2601.04859
A Navigational Approach for Comprehensive RAG via Traversal over Proposition Graphs

一、RAG 的三座“大山”

传统 RAG 方案
擅长
不擅长
Chunk-RAG
(整块召回)
简单事实问答
多跳、跨段落推理
Iterative-RAG
(链式思考)
局部多跳
缺乏全局视野,易走偏
KG-RAG
(三元组图谱)
复杂推理
单跳事实精度低,三元组信息压缩严重

一句话痛点:粒度 vs. 结构不可兼得——要么信息太粗,要么结构太硬。

二、ToPG 把“粒度”和“结构”同时做软

2.1 核心思想

图 1 一张图看懂 ToPG 框架

异构图:命题节点(蓝色)既连实体(橙色)也连段落(绿色),实现“细粒度+高连通”

命题(proposition)作为最小知识单元,把“实体-命题-段落”拼成一张异构图,再让 LLM 以“建议-选择(Suggestion-Selection)”的方式边导航边反馈,实现三种搜索模式:

模式
场景
导航策略
Naive
单跳事实
纯向量召回命题,不用图
Local
多跳推理
迭代 Suggestion-Selection,LLM 每轮筛掉噪音
Global
抽象/综述
多起点并行游走 → 社区检测 → 分面生成答案

2.2 关键技术细节

图 2 分步骤示例:Local 模式如何 2 跳找到“Gloria in D 大调作曲家出生地的著名桥梁”

Global 模式:多起点并行游走 → 社区检测 → 综述答案

模块
做法
公式/参数
图谱构建
LLM few-shot 抽取实体→命题;同义词用 embedding 合并
cosine ≥ 0.4
Query-Aware PPR
转移矩阵 M = λ·结构 + (1-λ)·语义相似度
λ = 0.5(实验最佳)
Local 迭代
每轮 LLM 判断“信息够了吗?”不够就自动生成子问题继续走
max-iter = 3
Global 社区
收集 600 个锚点 → Leiden 算法分社区 → 每社区生成中间答案 → 排序合并
budget = 8 k 节点

三、结论:一张表看懂涨点

单跳场景 Naive 模式已足够,Local 反而增加 token 成本;但在复杂场景,3 轮迭代即可把 F1 拉涨 11+

抽象问答(LLM-as-a-Judge)

图 3 胜率热力图:600 个锚点后收益饱和

维度
Agriculture
CS
Legal
Comprehensiveness
与 GraphRAG 持平
持平
略负
Diversity & Empowerment 显著优于
 GraphRAG & LightRAG
同上
同上

成本视角

图 4 Token 成本对比

方法
每抽象查询 token 消耗
备注
LightRAG
最低
关键词扩展,答案深度不足
ToPG-Global
中等(<600 锚点)
比 GraphRAG 省 30%+ 生成 token
GraphRAG
最高
预生成社区摘要,输入膨胀

四、一句话总结

ToPG 用“命题级粒度+查询感知游走”证明:把图谱做软、把导航做活,就能在单跳、多跳、抽象问答三条赛道都拿到 SOTA 级成绩。

53AI,企业落地大模型首选服务商

产品:场景落地咨询+大模型应用平台+行业解决方案

承诺:免费POC验证,效果达标后再合作。零风险落地应用大模型,已交付160+中大型企业

联系我们

售前咨询
186 6662 7370
预约演示
185 8882 0121

微信扫码

添加专属顾问

回到顶部

加载中...

扫码咨询