我要投稿

刚刚，法国Mistral 3系列模型发布，全部开源、全部多模态、全部能落地，对标中国模型

发布日期：2025-12-04 08:25:58 浏览次数： 3396

作者：HsuDan

微信搜一搜，关注“HsuDan”

12月2日，法国人工智能初创企业 Mistral AI 一口气扔出 Large 3 和 Ministral 3，全开源、能看图、能跑在大多数电子设备上，甚至断网也能用。

一款前沿级开源 MoE：Mistral Large 3，总参数量为 675B，激活参数为 41B；
「世界上最好的小型模型」：Ministral 3（14B、8B、3B），每个模型都发布了基础版、指令微调版和推理版。

这些模型及衍生版本均以 Apache 2.0 许可证开源。

Mistral Large 3 是在 3000 台 NVIDIA H200 GPU 上从头开始训练的，已成为全球最顶尖的开放权重模型之一。

通过采用英伟达的最新芯片技术，Mistral AI 开源模型家族的新成员在性能、效率和部署灵活性上实现跨越式提升。

Mistral Large 3（Base）在 MMLU、GPOA、SimpleQA、AMC、LiveCodeBench 等多项基础任务上与 DeepSeek 37B、Kimi K2 127B 保持同一水平，属于开源系的第一梯队底模。

在真实人工评估中，Mistral Large 3在通用任务和多语言任务里对DeepSeek V3.1、Kimi K2取得53%–60%的胜率。

Mistral Large 3 在 LMArena 排行榜的 OSS （开源软件）非推理模型类别中位列第二，OSS 总榜第六。

总的来说，Mistral Large 3 在开源大模型中稳居第一梯队，和 Kimi K2 打成平手，仅落后 DeepSeek v3.2一小截。

再说小模型，对于参数较小的 Ministral 3，Mistral AI 称其实现了所有 OSS 模型中最佳的性价比，这些模型的指令变体在性能上与同类模型相当或更优，同时生成的 token 数量通常降低了一个数量级。

图：GPQA Diamond Accuracy 对比 Ministral 3系列跑分

Ministral 3系列体量小，但性能强。3B、8B、14B三种大小，全部有base、instruct、reasoning三个版本，全部能看图，全部在官方benchmark里表现不俗。

在预训练能力方面，Mistral 3 和Qwen、Gemma的底模在核心评测上也能正面硬刚。

比如，Ministral 14B的底模实力远超同量级对手，在数学、知识问答、多语言任务中几乎全面领先Gemma 13B和Qwen 1.8B。

左右滑动查看更多

Ministral 3的instruct版本在综合智能指数上的得分分别是31（14B）/ 28（8B）/ 22（3B）──全部跑赢上一代Mistral Small 3.2，参数量甚至多40%。

Ministral 14B（Instruction）在WildBench、Arena Hard、数学推理和多模态任务上全面领先Gemma 13B与Qwen 1.8B，指令调优后的综合能力几乎碾压同量级模型。

左右滑动查看更多

Ministral 14B（Reasoning）在AIME’25、LiveCodeBench、GPOA Diamond、HMMT等推理任务上全面领先Qwen 14B「Thinking」，数学和代码推理几乎是同量级中的天花板。

左右滑动查看更多

值得注意的是，Mistral 在这里并没有对比刚发布几天的 DeepSeek-V3.2 正式版，可能是因为 DeepSeek 没有发布在普通语言任务上的基准测试结果，仅给出了推理和智能体任务的基准结果。

53AI，企业落地大模型首选服务商

产品：场景落地咨询+大模型应用平台+行业解决方案

承诺：免费POC验证，效果达标后再合作。零风险落地应用大模型，已交付160+中大型企业

相关资讯

2026-06-02

让 Agent 拥有超强记忆，TencentDB Agent Memory 开源了！

2026-06-02

Qwen3-ASR：阿里开源的语音识别大模型，一行命令干掉 Whisper

2026-06-02

拥抱 AI Agent 时代：12条工程实践指南

2026-05-31

亲测有效！Codex桌面版免费接入DeepSeek V4

2026-05-31

阿里开源语音识别「核弹」：170 倍实时、吊打 Whisper，还免费

2026-05-30

企业级 AI Agent 为什么集体转向“基座 + Skills”？

2026-05-25

DeepSeek 要用蜜雪冰城的打法，做中国版 Claude Code

2026-05-25

DeepSeek V4还能更省！新工具缓存命中率高达99.82%，2折稳定到手

联系获取

联系获取

160+中大型企业正在使用53AI

立即咨询预约演示

把握AI发展的机遇，共同探索、共同进步

2025-01-22

如何打造基于GenAI的员工服务机器人

2025-01-22

热点资讯

Hermes Agent 出来了，聊聊它凭什么跟 OpenClaw 掰手腕

2026-03-30

很多人突然不玩小龙虾而用Hermes Agent了。我替你试了，跟小龙虾到底有啥不同？

2026-04-09

Google Gemma 4 开源｜全面解读

2026-04-03

字节跳动开源 DeerFlow 2.0：下一代超级 Agent 引擎，一键搞定复杂工作流！

2026-03-23

震惊！刚刚，Anthropic掀了桌子：OpenClaude横空出世，大模型闭源时代彻底终结？

2026-04-01

刚刚，Claude Code开源了！51万行代码，全网狂欢

2026-03-31

OpenAI 刚开源了 Symphony：以后写代码，你只需要拖工单就行了

2026-03-09

龙虾绝配：Qwen 3.5 27B！跑在家里，成本为 0

2026-03-30

阿里开源龙虾组合来了：HiClaw + CoPaw，内存占用大幅降低，还能直接操作本地环境

2026-03-12

Ollama 本地部署 Gemma 4 完全指南

2026-04-18

大家都在问

企业级 AI Agent 为什么集体转向“基座 + Skills”？

2026-05-30

Hermes Agent 深度解析：为什么它能“越用越懂你”？

2026-05-16

百度把Nano Banana塞进4090，疯了？

2026-04-22

Kimi K2.6 开源了！还附送了 300 个 Agent 员工？

2026-04-21

Hermes 凭什么两个月接棒 OpenClaw？

2026-04-15

很多人突然不玩小龙虾而用Hermes Agent了。我替你试了，跟小龙虾到底有啥不同？

2026-04-09

震惊！刚刚，Anthropic掀了桌子：OpenClaude横空出世，大模型闭源时代彻底终结？

2026-04-01

英伟达的NemoClaw，能帮AI代理这匹“野马”套上缰绳吗？

2026-03-17

热门标签

内容创作大模型技术个人提效 langchain llamaindex 多模态技术 RAG技术智能客服知识图谱模型微调 RAGFlow coze Dify Fastgpt Bisheng Qanything AI+汽车 AI+金融 AI+工业 AI+培训 AI+SaaS Skill 提示词技巧 AI+电商 AI面试数字员工 ChatBI AI知识库开源大模型智能营销智能硬件 FDE AI+医疗 MaxKB Palantir Glean Openclaw

应聘简历请发送至： ceo@53ai.com

联系我们

售前咨询

预约演示

微信扫码

添加专属顾问

回到顶部