微信扫码
添加专属顾问
我要投稿
小米大模型MiMo-V2.5深夜突袭,性能飙升42% Token效率,AI智能体再升级!核心内容: 1. 小米MiMo-V2.5系列四大模型发布,专为智能体场景打造 2. 相比竞品节省42%-50% Token,推理速度更快 3. 实际演示:3D格斗游戏代码生成能力惊艳
智东西4月23日报道,刚刚,小米MiMo大模型一口气官宣4款新模型:旗舰推理模型MiMo-V2.5、全模态Agent模型V2.5-Pro开启公测、即将开源;V2.5-TTS Series、V2.5-ASR即将推出。
小米MiMo大模型负责人正是原DeepSeek核心成员、被业内称为“天才少女”的罗福莉,这距离上次MiMo-V2系列重磅三连更仅36天。上一代模型发布时,罗福莉曾发文称“未来模型足够稳定后,他们将开源”。
与上一代模型类似,MiMo-V2.5全系列同样是为智能体场景打造,MiMo-V2.5-Pro专为长难Agent任务打造,MiMo-V2.5可覆盖绝大多数通用Agent场景。
▲龙虎格斗游戏界面
有意思的是,今年3月,小米MiMo-V2-Pro曾以匿名模型Hunter Alpha的身份现身OpenRouter平台,一度被开发者误认为是即将发布的DeepSeek V4。如今小米新一代MiMo-V2.5推出,又正值DeepSeek V4被传出将于本周发布。
Xiaomi MiMo开放平台:
https://platform.xiaomimimo.com
小米官方称,MiMo-V2.5-Pro是小米MiMo迄今最强大模型,在通用智能体能力、复杂软件工程以及长程任务等维度上,能与Claude Opus 4.6、GPT-5.4等全球顶尖Agent模型相当,相较上一代模型MiMo-V2-Pro提升。
根据小米内部测试,搭配合适的运行框架,MiMo-V2.5-Pro可以稳定完成单次涉及近千轮工具调用的长程任务。且在智能体场景下,该模型指令遵循能力提升,其既能捕捉上下文中的隐性要求,又能在超长周期内保持逻辑一致。
小米MiMo放出了几个MiMo-V2.5-Pro的实操案例。
首先是“用Rust实现完整的SysY编译器”。这一任务的难点在于,模型需独立完成词法分析器、语法分析器、AST、Koopa IR代码生成、RISC-V汇编后端,以及性能优化。
在实际操作中,该模型采用逐层搭建整个编译器的方式,其先搭完整流水线骨架再逐层攻克。在各项的具体分数中,模型在Koopa IR、RISC-V后端、性能优化上都拿到了满分,首次编译实现了59%的冷启动通过率,这意味着在跑任何测试之前,架构是对的。在第512轮,该模型一次重构令lv9/riscv回退了两个测试点;模型自行诊断、恢复、继续推进。
这一任务是北京大学《编译原理》课程项目,北大本科生通常需要数周时间才能完成,MiMo-V2.5-Pro用时4.3小时、经过672次工具调用完成,在隐藏测试集上取得满分233分。
第二个官方案例是开发视频编辑器,其提示词为“构建一个视频编辑器Web应用”。MiMo-V2.5-Pro交付的Web应用具备多轨道时间线、片段裁剪、交叉淡化、音频混合以及导出流程等功能。其最终构建的代码量达8192行、历经1868次工具调用,在11.5小时的自主工作中完成。
MiMo-V2.5是专为智能体场景打造的原生全模态模型,能通过同时看、听、读,并根据感知到的信息采取行动。
该模型此次有两个关键升级点:Agent能力全面超越MiMo-V2-Pro、多模态感知全面超越MiMo-V2-Omni,MiMo-V2-Pro是小米MiMo系列上一代旗舰基座大模型、MiMo-V2-Omni是上一代全模态Agent模型。
其中,在面向AI智能体的端到端可信评测基准Claw-Eval中,MiMo-V2.5表现超过MiMo-V2-Pro,同时API成本降低约50%;在关于跨模态推理、视频理解、图表分析等的基准测试VideoMME、CharXiv、MMMU-Pro等评测中,MiMo-V2.5表现逼近甚至超越了Claude Opus 4.6、Gemini 3 Pro、GPT-5.4等闭源模型。
伴随MiMo-V2.5系列发布,小米还同步优化了其订阅式API调用套餐MiMo Token Plan,该计划允许用户使用MiMo系列8款模型,分别是旗舰推理模型MiMo-V2-Pro、MiMo-V2.5-Pro,全能多模态模型MiMo-V2-Omni、MiMo-V2.5,语音合成模型MiMo-V2-TTS、MiMo-V2.5-TTS、MiMo-V2.5-TTS-VoiceClone、MiMo-V2.5-TTS-VoiceDesign,后三个模型待发布。
首先是Credits速率更新、更优惠,取消1 Token=4 Credits计费方式,且不再区分256k和1M上下文窗口的Credit倍率。
新模型的Credits计费方式为:
MiMo-V2.5:1x(消耗1 Token=1 Credit)
MiMo-V2.5-Pro:2x(消耗1 Token=2 Credits)
作为对比,MiMo Token Plan刚发布时的计费方式为:
此外,MiMo Token Plan还会提供夜间专属优惠速率,每天00:00~08:00,所有模型Credits消耗速率在原有基础上再打8折。
在付费模式上,其此前预告的连续包月、包年订阅也已上线。连续包月中,老用户开通自动续费享次月7折,新用户享次月77折,包年订阅中,一次订阅享全年88折,包年至高可减948.96元。
截至北京时间4月22日22:00前,所有已购买Token Plan用户Credits额度将全部重置清零,但不重置套餐计时。
53AI,企业落地大模型首选服务商
产品:场景落地咨询+大模型应用平台+行业解决方案
承诺:免费POC验证,效果达标后再合作。零风险落地应用大模型,已交付160+中大型企业
2026-04-23
腾讯开源Cube Sandbox:60毫秒冷启动的AI沙盒运行时
2026-04-22
百度把Nano Banana塞进4090,疯了?
2026-04-21
Kimi K2.6 开源了!还附送了 300 个 Agent 员工?
2026-04-21
Kimi K2.6 发布并开源,全面精进代码和 Agent 集群能力
2026-04-20
借助 Gemma 4,将业界领先的 Agent Skills 引入端侧
2026-04-18
Ollama 本地部署 Gemma 4 完全指南
2026-04-18
Google Gemini CLI 完整使用指南
2026-04-18
ollama v0.21.0 最新更新:Hermes Agent 与 Ollama 联动、Copilot CLI 集成、launch 配置优化、Gemma4 与 MLX 多项性能修复全解析
2026-01-30
2026-01-27
2026-01-29
2026-01-27
2026-01-28
2026-01-26
2026-03-30
2026-01-23
2026-04-03
2026-03-23
2026-04-22
2026-04-21
2026-04-15
2026-04-09
2026-04-01
2026-03-17
2026-03-13
2026-03-02