微信扫码
添加专属顾问
我要投稿
法国Mistral AI发布全新开源模型系列,性能直逼中国顶尖AI,小模型性价比惊人!核心内容: 1. Mistral Large 3成为全球顶尖开源模型,性能对标DeepSeek和Kimi 2. Ministral 3系列实现最佳性价比,小模型性能全面超越同级别对手 3. 全系列支持多模态、本地部署,采用Apache 2.0许可证完全开源
12月2日,法国人工智能初创企业 Mistral AI 一口气扔出 Large 3 和 Ministral 3,全开源、能看图、能跑在大多数电子设备上,甚至断网也能用。
一款前沿级开源 MoE:Mistral Large 3,总参数量为 675B,激活参数为 41B;
「世界上最好的小型模型」:Ministral 3(14B、8B、3B),每个模型都发布了基础版、指令微调版和推理版。
这些模型及衍生版本均以 Apache 2.0 许可证开源。
Mistral Large 3 是在 3000 台 NVIDIA H200 GPU 上从头开始训练的,已成为全球最顶尖的开放权重模型之一。
通过采用英伟达的最新芯片技术,Mistral AI 开源模型家族的新成员在性能、效率和部署灵活性上实现跨越式提升。
Mistral Large 3(Base)在 MMLU、GPOA、SimpleQA、AMC、LiveCodeBench 等多项基础任务上与 DeepSeek 37B、Kimi K2 127B 保持同一水平,属于开源系的第一梯队底模。
在真实人工评估中,Mistral Large 3在通用任务和多语言任务里对DeepSeek V3.1、Kimi K2取得53%–60%的胜率。
Mistral Large 3 在 LMArena 排行榜的 OSS (开源软件)非推理模型类别中位列第二,OSS 总榜第六。
总的来说,Mistral Large 3 在开源大模型中稳居第一梯队,和 Kimi K2 打成平手,仅落后 DeepSeek v3.2一小截。
再说小模型,对于参数较小的 Ministral 3,Mistral AI 称其实现了所有 OSS 模型中最佳的性价比,这些模型的指令变体在性能上与同类模型相当或更优,同时生成的 token 数量通常降低了一个数量级。
图:GPQA Diamond Accuracy 对比 Ministral 3系列跑分
Ministral 3系列体量小,但性能强。3B、8B、14B三种大小,全部有base、instruct、reasoning三个版本,全部能看图,全部在官方benchmark里表现不俗。
在预训练能力方面,Mistral 3 和Qwen、Gemma的底模在核心评测上也能正面硬刚。
比如,Ministral 14B的底模实力远超同量级对手,在数学、知识问答、多语言任务中几乎全面领先Gemma 13B和Qwen 1.8B。
左右滑动查看更多
Ministral 3的instruct版本在综合智能指数上的得分分别是31(14B)/ 28(8B)/ 22(3B)──全部跑赢上一代Mistral Small 3.2,参数量甚至多40%。
Ministral 14B(Instruction)在WildBench、Arena Hard、数学推理和多模态任务上全面领先Gemma 13B与Qwen 1.8B,指令调优后的综合能力几乎碾压同量级模型。
左右滑动查看更多
Ministral 14B(Reasoning)在AIME’25、LiveCodeBench、GPOA Diamond、HMMT等推理任务上全面领先Qwen 14B「Thinking」,数学和代码推理几乎是同量级中的天花板。
左右滑动查看更多
值得注意的是,Mistral 在这里并没有对比刚发布几天的 DeepSeek-V3.2 正式版,可能是因为 DeepSeek 没有发布在普通语言任务上的基准测试结果,仅给出了推理和智能体任务的基准结果。
参考链接:https://mistral.ai/news/mistral-3
53AI,企业落地大模型首选服务商
产品:场景落地咨询+大模型应用平台+行业解决方案
承诺:免费POC验证,效果达标后再合作。零风险落地应用大模型,已交付160+中大型企业
2025-12-04
Transformers来到了v5时代:从工具包到真理之源,AI时代的操作系统内核的极简进化论
2025-12-04
Mistral 3发布,14B多模态小模型表现优异
2025-12-04
ollama v0.13.1 发布:全新 Ministral-3 与 Mistral-Large-3 模型,增强工具调用与GPU
2025-12-03
从硅谷杀出来一个彻底开源的AI记忆系统,是真的优雅!
2025-12-02
【开源推荐】国内首款开源公众号AI智能体,一键搞定仿写、改稿、自动回复!
2025-12-02
红熊AI“记忆熊”,让Agent拥有人类级记忆与认知能力
2025-12-01
OpenAI危!DeepSeek放大招:追平谷歌最强,手撕GPT-5 High
2025-12-01
京东云JoyAgent持续开源!多模态RAG能力正式开源
2025-09-07
2025-09-06
2025-10-20
2025-09-08
2025-11-19
2025-10-27
2025-10-27
2025-10-03
2025-09-17
2025-09-29
2025-11-12
2025-11-10
2025-11-03
2025-10-29
2025-10-28
2025-10-13
2025-09-29
2025-09-17