我要投稿

GraphRAG成本打一折，KET-RAG多粒度索引新框架开源

发布日期：2025-03-16 11:50:53 浏览次数： 2331

作者：PaperIdea

微信搜一搜，关注“PaperIdea”

摘要速览

研究痛点：现有的基于图的检索增强生成（Graph-RAG）系统在处理大规模文档时面临两难困境。

一方面，基于文本块相似性的KNN图方法虽然成本低，但无法捕捉文本内部的实体关系，导致检索和生成质量欠佳；
另一方面，基于知识图谱（KG-RAG）的方法虽然能通过提取实体和关系提升检索质量，但其高昂的索引成本使其难以大规模应用。例如，处理5GB法律文档的索引成本可能高达3.3万美元。

创新突破：

提出了KET-RAG（Knowledge-Entity-Text Retrieval-Augmented Generation），一种多粒度索引框架。KET-RAG通过以下创新实现高效低成本的知识检索：

知识图谱骨架：仅从核心文本块中构建知识图谱，大幅减少索引成本。
文本-关键词二分图：作为知识图谱的轻量级替代，通过关键词与文本块的关联实现高效检索。
双通道检索策略：结合知识图谱骨架和文本-关键词二分图的优势，平衡检索质量和成本。

应用价值：在两个真实世界的数据集上评估了八种解决方案，结果表明，KET-RAG 在索引成本、检索效果和生成质量方面均优于所有竞争对手(Text-RAG、KNNG-RAG、KG-RAG、Hybrid-RAG、Skeleton-RAG)。

值得注意的是，KET-RAG 的检索质量与微软的 Graph-RAG 相当甚至更优，同时索引成本降低了超过一个数量级。

? 方案详情

KET-RAG框架的核心在于结合多粒度索引结构，具体包括以下部分：

知识图谱骨架（Skeleton-RAG）：通过PageRank算法从KNN图中选择重要文本块，并仅对这些核心文本块构建知识图谱，减少索引成本。
文本-关键词二分图（Keyword-RAG）：将所有文本块分割为子块，并构建关键词与子块的关联图。关键词及其邻近文本块作为候选实体和关系，用于轻量级检索。
双通道检索：在检索阶段，KET-RAG结合知识图谱骨架和文本-关键词二分图的优势，通过调整检索比例参数（??）平衡两者贡献，提升检索质量。
参数优化：通过调整输入文本块大小（ℓ）、分割层数（??）等参数，进一步优化检索和生成性能。

KET-RAG通过这种多粒度索引和双通道检索策略，在保证检索质量的同时，大幅降低了索引成本，为大规模知识检索和生成任务提供了高效、低成本的解决方案。

https://arxiv.org/pdf/2502.09304KET-RAG: A Cost-Efficient Multi-Granular Indexing Framework for Graph-RAG

53AI，企业落地大模型首选服务商

产品：场景落地咨询+大模型应用平台+行业解决方案

承诺：免费POC验证，效果达标后再合作。零风险落地应用大模型，已交付160+中大型企业

相关资讯

2026-03-13

你的 AI Agent 真的在受控运行吗？

2026-03-12

Harness Engineering 的防御视角：从 Codex Security 看 AI 生成代码的治理

2026-03-12

阿里开源龙虾组合来了：HiClaw + CoPaw，内存占用大幅降低，还能直接操作本地环境

2026-03-12

大厂抢的不是“龙虾”，是人与AI的新型关系

2026-03-11

Google Workspace 团队开源了一个工具，叫 gws，直接搬进终端里了。

2026-03-11

OpenClaw爆火背后，我们所见的时代情绪 | Linear View

2026-03-11

开源 AI 收藏夹：全平台同步、自动摘要、智能对话，太强了！

2026-03-11

OpenAI 开源 Symphony！四天狂揽 8.7K Star，AI 编程自主管理神器！

联系获取

160+中大型企业正在使用53AI

立即咨询预约演示

把握AI发展的机遇，共同探索、共同进步

2025-01-22

如何打造基于GenAI的员工服务机器人

2025-01-22

热点资讯

Clawdbot 完整安装教学：2026 年最火的开源AI 个人助理

2026-01-27

重磅开源！Kimi K2.5 本地部署全攻略：手把手教你跑通 1T MoE 巨兽

2026-01-30

SkillsMP：一个聚合了 5 万+ AI Agent 技能的开源社区

2026-01-12

Clawdbot 深度拆解： 7 个问题看懂它。

2026-01-29

实测Kimi K2.5，这是一款厌丑的开源模型

2026-01-27

ClawdBot 火爆全网，手把手教你如何部署，还能直接用钉钉操作！

2026-01-28

2025-12-22

OpenWork：Claude Cowork 的开源替代品

2026-01-21

我把Claude Code换成GLM-4.7用了6小时，我竟然没发现明显区别

2025-12-23

Claude Code最强开源对手！GitHub 50.2k Star了，作者为它烧掉2.4w美元。

2026-01-06

大家都在问

你的 AI Agent 真的在受控运行吗？

2026-03-13

137K 行代码、零 clippy 警告：这个开源项目凭什么让 AI Agent 领域炸锅？

2026-03-02

Clawdbot 如何实现像人一样的长期记忆？

2026-02-05

一夜爆火，Clawdbot是否才是真正的AI入口产品？

2026-01-28

Clawdbot爆火：Karpathy点赞的开源AI助理，到底是什么？

2026-01-26

速递 | DeepSeek突然扔出MODEL1，这到底是V4还是R2？

2026-01-21

DeepSeek-R2要来了？

2026-01-21

TranslateGemma-27B谷歌开源翻译模型有多强？

2026-01-20

热门标签

内容创作大模型技术个人提效 langchain llamaindex 多模态技术 RAG技术智能客服知识图谱模型微调 RAGFlow coze Dify Fastgpt Bisheng Qanything AI+汽车 AI+金融 AI+工业 AI+培训 AI+SaaS Skill 提示词技巧 AI+电商 AI面试数字员工 ChatBI AI知识库开源大模型智能营销智能硬件智能化改造 AI+医疗 MaxKB Palantir Glean Openclaw