微信扫码
添加专属顾问
我要投稿
ComRAG框架通过“质心式”记忆机制,巧妙解决了社区问答平台的三大痛点,性能比RAG提升27.4%。 核心内容: 1. 社区问答平台面临的三大挑战与现有方法的不足 2. ComRAG框架的双库设计与质心记忆机制详解 3. 实验验证中ComRAG在多个数据集上的显著性能提升
社区问答(CQA)平台(如 Stack Overflow、AskUbuntu)沉淀了大量高质量知识,但在工业界落地时仍面临三大挑战:
现有方法要么只检索社区历史,要么只用静态文档,缺少“动态反思 + 高效存储”的机制。ComRAG 正是为了解决这些痛点而生。
*图 1:ComRAG 实时社区问答(CQA)架构。系统整合了一个静态知识向量库和两个动态 CQA 向量库(高质量与低质量),后者通过基于质心的记忆机制进行管理。
核心思想一句话:“既要官方文档的权威,也要社区历史的经验,还要随时间动态遗忘低质量内容”。
为了处理“质量不一致 + 存储无限膨胀”两个问题,作者提出双库 + 质心记忆机制:
| High-Quality Store | ||
| Low-Quality Store |
图 4:利用质心聚类控制存储增长,ProCQA 上 10 轮迭代后 chunk 增长率从 20.23% 降到 2.06%
收到新问题 q 时,ComRAG 按相似度阈值 τ, δ 走三条路径之一:
| MSQA | ||||
| ProCQA | ||||
| PolarDBQA |
指标:
表 1:三大数据集上 ComRAG 均显著优于所有基线
图 2:PolarDBQA 上移除任一模组都会显著降低 BERT-Score 或增加延迟
| 效果 | |
| 效率 | |
| 存储 | |
| 可插拔 |
“ComRAG 的核心价值不在于模型本身,而在于用质心记忆机制把‘时间’和‘质量’显式建模进了检索-生成流程。”
https://arxiv.org/abs/2506.21098ComRAG: Retrieval-Augmented Generation with Dynamic Vector Stores for Real-time Community Question Answering in Industry
53AI,企业落地大模型首选服务商
产品:场景落地咨询+大模型应用平台+行业解决方案
承诺:免费POC验证,效果达标后再合作。零风险落地应用大模型,已交付160+中大型企业
2026-02-25
如何在记忆与检索环节,解决OpenClaw 的token消耗爆炸问题?
2026-02-22
不用向量数据库的 RAG,居然跑得更准了?
2026-02-22
AIOps探索:做运维领域的RAG,如何做数据清洗
2026-02-21
Claude Code 每次都要重新探索代码?这个工具直接省下30%成本
2026-02-18
函数计算 AgentRun 重磅上线知识库功能,赋能智能体更“懂”你
2026-02-15
当RAG遇上Agent记忆:为什么相似度检索会"塌方"?
2026-02-15
查个问题还要全图跑一遍?DA-RAG说我只取一瓢
2026-02-14
OpenClaw 终于能"记住"事了!我花了 3 周折腾出的长期记忆系统
2026-01-15
2025-12-04
2025-12-03
2025-12-02
2026-01-02
2025-12-23
2025-12-07
2026-02-11
2025-12-18
2026-02-03
2026-02-25
2026-02-22
2026-02-15
2026-02-04
2026-02-03
2026-01-19
2026-01-12
2026-01-08