我要投稿

8B模型媲美Claude？DeepResearch终于本地化了：拖入PDF，自动生成万字研报

发布日期：2026-01-21 20:08:50 浏览次数： 2228

作者：PaperWeekly

微信搜一搜，关注“PaperWeekly”

在深度研究（DeepResearch）席卷而来的今天，我们习惯了认为，只有千亿参数的云端大模型才能处理复杂的深度调研。

但今天，这个既定认知被打破了。

AgentCPM-Report 正式开源。这款由清华大学自然语言处理实验室、中国人民大学、面壁智能与 OpenBMB 开源社区联合研发的智能体，不仅仅是一个本地化的 DeepResearch 工具，更代表了端侧模型能力边界的一次重新定义。

它基于 8B 参数的端侧模型，利用写作即推理的迭代优化框架，实现了比肩顶级闭源系统（Claude/Gemini）的万字长文写作能力。

无需昂贵的算力集群，无需上传核心数据，只需一张消费级显卡，你的本地文档库就能变成一个深度的洞察引擎。

⭐ AgentCPM-Report 核心亮点

极致效能，以小博大：它是如何跨越参数鸿沟的？秘密在于高密度的思考——单次调研包含平均 40 轮的深度检索与近 100 轮的思维链推演。这种对信息全方位的挖掘与重组能力，让小模型突破了逻辑瓶颈，产出的报告在严密性与洞察力上真正做到了越级挑战。

物理隔绝，本地安全：专为高隐私场景设计，支持完全离线的本地化敏捷部署，彻底杜绝云端泄密风险。基于技术团队的 UltraRAG 框架，它能高效挂载并理解您的本地私有知识库，让核心机密数据在“不出域”的前提下，安全地转化为极具价值的专业决策报告。

项目地址

👇

AgentCPM-Report 开源地址：

https://github.com/OpenBMB/AgentCPM

https://huggingface.co/openbmb/AgentCPM-Report

https://modelscope.cn/models/OpenBMB/AgentCPM-Report

https://gitcode.com/OpenBMB/AgentCPM

https://modelers.cn/models/OpenBMB/AgentCPM-Report

UltralRAG 框架开源地址：

https://github.com/OpenBMB/UltraRAG

写作能力对标闭源最强标杆

在 DeepResearch Bench、Deep Consult 以及 DeepResearch Gym 三大主流深度调研评测基准中，AgentCPM-Report 展现了惊人的越级战斗力，综合评分达到甚至超越顶级闭源系统。

在最考验深度的洞察性指标上，AgentCPM-Report 力压群雄，排名第一；而在全面性指标上，也仅次于基于 Claude 的复杂写作框架，位居第一梯队。

从零构建《三体》“面壁计划”深度报告

光看跑分不够，我们直接上实战。我们要求 AgentCPM-Report 以三体原文为知识库，生成一篇关于“面壁计划”来龙去脉的调查报告。在下方视频中，您将看到它从线索挖掘、大纲规划到万字长文撰写的全过程：

极简部署教程

配合 UltraRAG 框架一键部署，你就能拥有专属的深度调研助手：

Docker 一键启动：通过 Docker 可在本地光速启动 UltraRAG 服务与 AgentCPM 智能体；

拖拽式知识库构建：无需编写代码，直接将本地的 PDF、TXT 等私有文档拖入后台，系统自动完成切片与向量化索引；

沉浸式深度调研：输入研究课题，即可让智能体生成结构化、带引用的专业报告。

技术解密：端侧模型如何“以弱胜强”

AgentCPM-Report 之所以能以 8B 参数媲美闭源系统源于两大技术创新：

创新一：“写作即推理”模式，让思考更贴近人脑

传统方案试图让模型“一口气”生成完整大纲或内容，容易造成产出报告的逻辑崩塌，对于小模型来说是更是难上加难。AgentCPM-Report 创新性地采用了“边写作，边规划”的迭代精炼框架打破这一局限：

两阶段循环：系统在 “起草” 与 “深化” 两个状态间不断交替。就像人类专家一样，写完一段草稿后，会立即停下来反思：“有没有需要补充的地方？侧重点应该是怎样的？”，然后回头扩展章节、补充检索、填充新内容。

渐进式优化：将宏大的万字长文任务，拆解为一系列可执行的微小目标。模型在每一轮循环中只需解决当下的局部问题，从而在较小的参数规模条件下产出逻辑严密、细节丰富的长篇报告。

创新二：“多阶段智能体学习”，全方位能力提升

1. 四大核心能力拆解

技术团队将完整报告协作拆解为四个核心能力模块，并针对性地进行强化训练：

🔍 智能检索能力：以“召回率”为核心优化指标，确保检索内容高度相关，为写作奠定坚实基础；

📝 流畅写作能力：建立多维度质量评估体系，从内容深度到表达清晰度全面把关；

🗺️ 科学规划能力：对生成大纲进行结构化评估，确保报告逻辑严谨、层次分明；

🎯 精准决策能力：采用“轨迹剪枝”技术，构造高质量数据，解决“何时停止深化”的关键决策问题。

2. 三阶段训练法：从入门到精通

训练过程同样精心设计：

有监督微调：高质量范文引导，掌握写作基本范式；

原子能力强化：针对每项核心原子能力进行专项提升；

全流程优化：端到端全链路强化学习，以最终报告质量为唯一目标，打通所有能力关节。

即刻体验：把 DeepResearch 装进你的硬盘

AgentCPM-Report 现已开源。这是首个真正可本地化部署、达到实用级别的深度调研系统。你的数据，只属于你自己。

诚邀开发者与研究人员亲自动手，按照教程部署，加载你的私有知识库，体验“数据不出域”的专业级报告生成！

53AI，企业落地大模型首选服务商

产品：场景落地咨询+大模型应用平台+行业解决方案

承诺：免费POC验证，效果达标后再合作。零风险落地应用大模型，已交付160+中大型企业

相关资讯

2026-06-06

老黄刚夸完OpenClaw，Hermes反手把智能体搬进电脑桌面_tag2

2026-06-05

一周 3.3k Star：微软 SkillOpt 开源，Agent Skill技能也能训练了，简直太香了（文末附领取方式）_tag2

2026-06-05

DeepSeek+Codex：如何在消费级显卡上跑出满血编程能力_tag2

2026-06-05

OpenClaw刚发Windows版就爆了！下载量超Mac三倍，“无需企鹅装”暗藏AI智能体落地的万亿风口_tag2

2026-06-05

商汤SenseNova-Skills来了，全套办公技能：从凌乱数据到精美PPT直接交付_tag2

2026-06-04

腾讯开源了 Agent Memory，让 AI 真正记住你。_tag2

2026-06-04

AionUi 统一接管 OpenClaw 与 Hermes Agent

2026-06-04

重磅！谷歌开源Gemma 4 12B：统一的、无编码器的多模态模型，16G内存笔记本就可以跑

联系获取

160+中大型企业正在使用53AI

立即咨询预约演示

把握AI发展的机遇，共同探索、共同进步

2025-01-22

如何打造基于GenAI的员工服务机器人

2025-01-22

热点资讯

Hermes Agent 出来了，聊聊它凭什么跟 OpenClaw 掰手腕

2026-03-30

很多人突然不玩小龙虾而用Hermes Agent了。我替你试了，跟小龙虾到底有啥不同？

2026-04-09

Google Gemma 4 开源｜全面解读

2026-04-03

字节跳动开源 DeerFlow 2.0：下一代超级 Agent 引擎，一键搞定复杂工作流！

2026-03-23

震惊！刚刚，Anthropic掀了桌子：OpenClaude横空出世，大模型闭源时代彻底终结？

2026-04-01

刚刚，Claude Code开源了！51万行代码，全网狂欢

2026-03-31

OpenAI 刚开源了 Symphony：以后写代码，你只需要拖工单就行了

2026-03-09

龙虾绝配：Qwen 3.5 27B！跑在家里，成本为 0

2026-03-30

阿里开源龙虾组合来了：HiClaw + CoPaw，内存占用大幅降低，还能直接操作本地环境

2026-03-12

Ollama 本地部署 Gemma 4 完全指南

2026-04-18

大家都在问

企业级 AI Agent 为什么集体转向“基座 + Skills”？

2026-05-30

Hermes Agent 深度解析：为什么它能“越用越懂你”？

2026-05-16

百度把Nano Banana塞进4090，疯了？

2026-04-22

Kimi K2.6 开源了！还附送了 300 个 Agent 员工？

2026-04-21

Hermes 凭什么两个月接棒 OpenClaw？

2026-04-15

很多人突然不玩小龙虾而用Hermes Agent了。我替你试了，跟小龙虾到底有啥不同？

2026-04-09

震惊！刚刚，Anthropic掀了桌子：OpenClaude横空出世，大模型闭源时代彻底终结？

2026-04-01

英伟达的NemoClaw，能帮AI代理这匹“野马”套上缰绳吗？

2026-03-17

热门标签

内容创作大模型技术个人提效 langchain llamaindex 多模态技术 RAG技术智能客服知识图谱模型微调 RAGFlow coze Dify Fastgpt Bisheng Qanything AI+汽车 AI+金融 AI+工业 AI+培训 AI+SaaS Skill 提示词技巧 AI+电商 AI面试数字员工 ChatBI AI知识库开源大模型智能营销智能硬件 FDE AI+医疗 MaxKB Palantir Glean Openclaw