微信扫码
添加专属顾问
我要投稿
8B参数模型也能媲美Claude?DeepResearch本地化革命来了,拖入PDF即可自动生成万字深度研报!核心内容: 1. AgentCPM-Report突破性技术:8B端侧模型实现媲美顶级闭源系统的写作能力 2. 两大核心优势:极致效能的小模型突破与物理隔绝的本地安全部署 3. 实测表现:在三大评测基准中超越顶级系统,实战生成《三体》深度报告
在深度研究(DeepResearch)席卷而来的今天,我们习惯了认为,只有千亿参数的云端大模型才能处理复杂的深度调研。
但今天,这个既定认知被打破了。
AgentCPM-Report 正式开源。这款由清华大学自然语言处理实验室、中国人民大学、面壁智能与 OpenBMB 开源社区联合研发的智能体,不仅仅是一个本地化的 DeepResearch 工具,更代表了端侧模型能力边界的一次重新定义。
它基于 8B 参数的端侧模型,利用写作即推理的迭代优化框架 ,实现了比肩顶级闭源系统(Claude/Gemini)的万字长文写作能力。
无需昂贵的算力集群,无需上传核心数据,只需一张消费级显卡,你的本地文档库就能变成一个深度的洞察引擎。
⭐ AgentCPM-Report 核心亮点
极致效能,以小博大:它是如何跨越参数鸿沟的?秘密在于高密度的思考——单次调研包含平均 40 轮的深度检索与近 100 轮的思维链推演。这种对信息全方位的挖掘与重组能力,让小模型突破了逻辑瓶颈,产出的报告在严密性与洞察力上真正做到了越级挑战。
物理隔绝,本地安全:专为高隐私场景设计,支持完全离线的本地化敏捷部署,彻底杜绝云端泄密风险。基于技术团队的 UltraRAG 框架,它能高效挂载并理解您的本地私有知识库,让核心机密数据在“不出域”的前提下,安全地转化为极具价值的专业决策报告。
项目地址
AgentCPM-Report 开源地址:
https://github.com/OpenBMB/AgentCPM
https://huggingface.co/openbmb/AgentCPM-Report
https://modelscope.cn/models/OpenBMB/AgentCPM-Report
https://gitcode.com/OpenBMB/AgentCPM
https://modelers.cn/models/OpenBMB/AgentCPM-Report
UltralRAG 框架开源地址:
https://github.com/OpenBMB/UltraRAG
写作能力对标闭源最强标杆
在 DeepResearch Bench、Deep Consult 以及 DeepResearch Gym 三大主流深度调研评测基准中,AgentCPM-Report 展现了惊人的越级战斗力,综合评分达到甚至超越顶级闭源系统。
在最考验深度的洞察性指标上,AgentCPM-Report 力压群雄,排名第一;而在全面性指标上,也仅次于基于 Claude 的复杂写作框架,位居第一梯队。
从零构建《三体》“面壁计划”深度报告
光看跑分不够,我们直接上实战。我们要求 AgentCPM-Report 以三体原文为知识库,生成一篇关于“面壁计划”来龙去脉的调查报告。在下方视频中,您将看到它从线索挖掘、大纲规划到万字长文撰写的全过程:
极简部署教程
配合 UltraRAG 框架一键部署,你就能拥有专属的深度调研助手:
Docker 一键启动:通过 Docker 可在本地光速启动 UltraRAG 服务与 AgentCPM 智能体;
拖拽式知识库构建:无需编写代码,直接将本地的 PDF、TXT 等私有文档拖入后台,系统自动完成切片与向量化索引;
沉浸式深度调研:输入研究课题,即可让智能体生成结构化、带引用的专业报告。
技术解密:端侧模型如何“以弱胜强”
AgentCPM-Report 之所以能以 8B 参数媲美闭源系统源于两大技术创新:
创新一:“写作即推理”模式,让思考更贴近人脑
传统方案试图让模型“一口气”生成完整大纲或内容,容易造成产出报告的逻辑崩塌,对于小模型来说是更是难上加难。AgentCPM-Report 创新性地采用了“边写作,边规划”的迭代精炼框架打破这一局限:
两阶段循环:系统在 “起草” 与 “深化” 两个状态间不断交替。就像人类专家一样,写完一段草稿后,会立即停下来反思:“有没有需要补充的地方?侧重点应该是怎样的?”,然后回头扩展章节、补充检索、填充新内容。
渐进式优化:将宏大的万字长文任务,拆解为一系列可执行的微小目标。模型在每一轮循环中只需解决当下的局部问题,从而在较小的参数规模条件下产出逻辑严密、细节丰富的长篇报告。
创新二:“多阶段智能体学习”,全方位能力提升
1. 四大核心能力拆解
技术团队将完整报告协作拆解为四个核心能力模块,并针对性地进行强化训练:
🔍 智能检索能力:以“召回率”为核心优化指标,确保检索内容高度相关,为写作奠定坚实基础;
📝 流畅写作能力:建立多维度质量评估体系,从内容深度到表达清晰度全面把关;
🗺️ 科学规划能力:对生成大纲进行结构化评估,确保报告逻辑严谨、层次分明;
🎯 精准决策能力:采用“轨迹剪枝”技术,构造高质量数据,解决“何时停止深化”的关键决策问题。
2. 三阶段训练法:从入门到精通
训练过程同样精心设计:
有监督微调:高质量范文引导,掌握写作基本范式;
原子能力强化:针对每项核心原子能力进行专项提升;
全流程优化:端到端全链路强化学习,以最终报告质量为唯一目标,打通所有能力关节。
AgentCPM-Report 现已开源。这是首个真正可本地化部署、达到实用级别的深度调研系统。你的数据,只属于你自己。
诚邀开发者与研究人员亲自动手,按照教程部署,加载你的私有知识库,体验“数据不出域”的专业级报告生成!
📧 合作联系: agentcpm@modelbest.cn;
💬 技术交流: 扫描下方二维码加入讨论群,期待您的建议与反馈。
🔍
现在,在「知乎」也能找到我们了
进入知乎首页搜索「PaperWeekly」
点击「关注」订阅我们的专栏吧
53AI,企业落地大模型首选服务商
产品:场景落地咨询+大模型应用平台+行业解决方案
承诺:免费POC验证,效果达标后再合作。零风险落地应用大模型,已交付160+中大型企业
2026-01-21
10B击败200B!阶跃星辰10B视觉语言SOTA模型开源
2026-01-21
刷新 Google AlphaEvolve 进化结果,百度开源 Agent 开发框架 LoongFlow
2026-01-21
“DeepSeek 时刻” 一周年
2026-01-21
速递 | DeepSeek突然扔出MODEL1,这到底是V4还是R2?
2026-01-21
DeepSeek-R2要来了?
2026-01-21
刚刚,DeepSeek新模型MODEL1曝光,3处架构升级!
2026-01-21
开源+AI双 buff!Paper2Slides:让论文转幻灯片,从 “耗时半天” 到 “1 分钟搞定”
2026-01-21
MiroThinker v1.5:开源搜索智能体的革命性突破,重新定义AI交互
2025-11-19
2025-10-27
2025-10-27
2025-12-22
2025-12-10
2025-11-17
2025-11-07
2025-10-29
2025-10-24
2025-12-23
2026-01-21
2026-01-21
2026-01-20
2026-01-16
2026-01-02
2025-12-24
2025-12-22
2025-11-12