微信扫码
添加专属顾问
我要投稿
这是豆包大模型 1.5 Pro 全面升级的重磅发布,性能卓越,成果斐然! 核心内容: 1. 模型能力的全面升级亮点 2. 创新的模型架构与性能优势 3. 自主数据生产体系的构建
今天,豆包全新基础模型 Doubao-1.5-pro 正式发布,模型能力全面升级,融合并进一步提升了多模态能力。
模型使用 MoE 架构,并通过训练-推理一体化设计,探索模型性能和推理性能之间的极致平衡。Doubao-1.5-pro 仅用较小激活参数,即可比肩一流超大稠密预训练模型的性能,并在多个评测基准上取得优异成绩。值得注意的是,通过模型结构和训练算法优化,我们将 MoE 模型的性能杠杆提升至 7 倍,此前,业界的普遍水平为不到 3 倍。
此外,团队还构建了高度自主的数据生产体系,坚持不走捷径,不使用任何其他模型的数据,确保数据来源的独立性和可靠性。
如何用较小参数激活的 MoE 模型,达到世界一流模型的性能
如何在保证模型性能的前提下,将推理成本压缩到极致
如何构建高度自主的数据生产体系
多模态能力的提升及表现
完整版 Blog ,可在豆包大模型团队官网查看:
https://team.doubao.com/doubao_1_5_pro
此次更新,Doubao-1.5-pro 基础模型能力全面提升,在多个公开评测基准上表现优异。
Doubao-1.5-pro 在多个基准上的评测结果
其它模型的评测指标来自官方评测结果,官方评测结果中不含的部分来自内部评测平台结果
Doubao-Dense、Doubao-MoE 均为 9T tokens 数据的阶段性结果,数据分布完全相同;MoE 模型的性能略优于整体参数量为 MoE 激活参数量 7 倍的稠密模型
Llama3.1-405B 为 15T tokens 的最终结果,数据分布和 Doubao 模型不同,Doubao 稠密模型的参数量也远小于 Llama3.1-405B ,从结果上可以看到 Doubao 预训练的数据质量和训练超参更优
MoE 模型完整训练后的性能比 9T tokens 数据的中间版本有更大提升
在预训练模型基础上,算法团队还设计了一系列模型参数动态调整算法。可以基于具体应用对模型性能的需求,从模型深度、宽度、MoE 专家数、激活专家数、隐藏 token 推理等不同维度,对模型参数进行扩增和缩小,达到模型能力和推理成本的最优平衡。同时,较小的预训练模型提高了团队迭代开发的效率,可以并发支持多个产品线。
整体来看,在 PD 分离的 Serving 系统上,我们实现了以下优化:
相比于此前发布的 Doubao 视觉理解模型版本,Doubao-1.5-pro 在多模态数据合成、动态分辨率、多模态对齐、混合训练上进行了全面的技术升级,进一步增强了模型在视觉推理、文字文档识别、细粒度信息理解、指令遵循方面的能力,并让模型的回复模式变得更加精简、友好。
在评测中 GPT4o-1120 在多模态能力上要优于 GPT4o-0806
文本与视觉混合的多模态能力:为同时保障模型的视觉和语言能力,团队在 VLM 多个训练阶段都混入了一定比例的纯文本数据,并通过动态调整学习率的方法平衡视觉与语言能力,使模型的语言能力无损。
目前,阶段性成果 Doubao-1.5-pro-AS1-Preview 在 AIME 上已经超过 O1-preview、O1 等推理模型。并且,随着 RL 的持续,模型能力还将不断提升。在这一过程中,我们也看到了推理能力在不同领域的泛化,智能的边界正在被慢慢拓宽。
豆包大模型团队一直以探索智能的无尽边界、解锁通用智能的无限可能为目标。同时,我们认为探索智能的边界与服务用户和行业是一体的关系,两者可以彼此增益、双向驱动。接下来,团队会继续加强对大模型基础研究的投入,挑战更长周期的、具有颠覆性的通用智能研究课题
53AI,企业落地大模型首选服务商
产品:场景落地咨询+大模型应用平台+行业解决方案
承诺:免费POC验证,效果达标后再合作。零风险落地应用大模型,已交付160+中大型企业
2026-05-01
永别了,终端!OpenAI疯狂升级Codex,接管Mac人类全程0操作围观
2026-04-30
Karpathy 最新访谈:Vibe Coding 只是开始,真正重要的是 Agentic Engineering
2026-04-30
近4万Star!一个终端把自己变成了AI开发环境,Cursor和Claude Code都沉默了
2026-04-29
Claude Code 的 Memory 系统:让 AI 记住你的偏好
2026-04-29
深入浅出Harness Engineerring之核心模式与理念
2026-04-28
别急着All-in DeepSeek V4,先看看这10位从业者的真心话
2026-04-28
你不知道的 Agent:原理、架构与工程实践
2026-04-27
从 Prompt 到 Harness,Agent 进入企业需要流程治理吗
2026-04-15
2026-03-31
2026-03-13
2026-02-14
2026-02-03
2026-02-03
2026-02-03
2026-03-17
2026-02-09
2026-03-17
2026-04-26
2026-04-22
2026-04-18
2026-04-13
2026-04-12
2026-04-07
2026-04-01
2026-03-31