微信扫码
添加专属顾问
我要投稿
ComRAG框架通过“质心式”记忆机制,巧妙解决了社区问答平台的三大痛点,性能比RAG提升27.4%。 核心内容: 1. 社区问答平台面临的三大挑战与现有方法的不足 2. ComRAG框架的双库设计与质心记忆机制详解 3. 实验验证中ComRAG在多个数据集上的显著性能提升
社区问答(CQA)平台(如 Stack Overflow、AskUbuntu)沉淀了大量高质量知识,但在工业界落地时仍面临三大挑战:
现有方法要么只检索社区历史,要么只用静态文档,缺少“动态反思 + 高效存储”的机制。ComRAG 正是为了解决这些痛点而生。
*图 1:ComRAG 实时社区问答(CQA)架构。系统整合了一个静态知识向量库和两个动态 CQA 向量库(高质量与低质量),后者通过基于质心的记忆机制进行管理。
核心思想一句话:“既要官方文档的权威,也要社区历史的经验,还要随时间动态遗忘低质量内容”。
为了处理“质量不一致 + 存储无限膨胀”两个问题,作者提出双库 + 质心记忆机制:
High-Quality Store | ||
Low-Quality Store |
图 4:利用质心聚类控制存储增长,ProCQA 上 10 轮迭代后 chunk 增长率从 20.23% 降到 2.06%
收到新问题 q 时,ComRAG 按相似度阈值 τ, δ 走三条路径之一:
MSQA | ||||
ProCQA | ||||
PolarDBQA |
指标:
表 1:三大数据集上 ComRAG 均显著优于所有基线
图 2:PolarDBQA 上移除任一模组都会显著降低 BERT-Score 或增加延迟
效果 | |
效率 | |
存储 | |
可插拔 |
“ComRAG 的核心价值不在于模型本身,而在于用质心记忆机制把‘时间’和‘质量’显式建模进了检索-生成流程。”
https://arxiv.org/abs/2506.21098ComRAG: Retrieval-Augmented Generation with Dynamic Vector Stores for Real-time Community Question Answering in Industry
53AI,企业落地大模型首选服务商
产品:场景落地咨询+大模型应用平台+行业解决方案
承诺:免费POC验证,效果达标后再合作。零风险落地应用大模型,已交付160+中大型企业
2025-08-28
自适应RAG:用本地 LLM 构建更聪明的检索增强生成系统
2025-08-28
使用RAG构建高质量知识库(四)- 数据检索
2025-08-28
RAG检索后如何应用更有效?
2025-08-28
RAG 不止能检索!它还能在 LangGraph 中当“工具调用大脑”
2025-08-28
RAG进阶神技:让AI自动将“人话”翻译成SQL和Cypher查询!
2025-08-28
如何将 RAG 检索召回率从 50% 提高到 95% 以上
2025-08-28
告别“搜不到、搜不准”:用这套查询优化,让你的RAG检索召回率飙升
2025-08-27
如何评估RAG系统:给你的AI助手做个"体检"
2025-06-05
2025-06-06
2025-06-05
2025-06-05
2025-06-20
2025-06-20
2025-06-24
2025-07-15
2025-06-24
2025-06-05