免费POC, 零成本试错
AI知识库

53AI知识库

学习大模型的前沿技术与行业应用场景


我要投稿

重磅!千问最强模型正式发布

发布日期:2026-01-26 23:41:41 浏览次数: 1550
作者:阿里云

微信搜一搜,关注“阿里云”

推荐语

阿里发布千问最强推理模型Qwen3-Max-Thinking,万亿参数+36T数据训练,性能全面超越国际顶尖AI!

核心内容:
1. 模型规模与性能突破:万亿参数、36T Tokens数据训练,刷新19项基准测试纪录
2. 创新测试时扩展机制:实现更经济的推理性能提升,效率远超同类产品
3. 原生Agent能力升级:支持自主调用工具,HLE测试得分全球第一

杨芳贤
53AI创始人/腾讯云(TVP)最具价值专家

刚刚,阿里正式发布千问旗舰推理模型Qwen3-Max-Thinking。该模型总参数量超万亿(1T),预训练数据量高达36T Tokens,是目前阿里规模最大、能力最强的千问推理模型。


千问新模型通过总参数、强化学习、推理计算的极致规模扩展,实现了性能的大幅飞跃,在多项关键性能基准测试中刷新全球新纪录。同时,该模型采用全新测试时扩展机制,推理性能提升同时更经济,并大幅增强原生Agent能力,模型对话时可自主调用工具。



目前,开发者可在QwenChat上免费体验Qwen3-Max-Thinking模型,企业可通过阿里云百炼获取新模型API服务,普通用户也可通过千问PC端和网页端试用模型。此外,千问APP也即将接入新模型,所有用户都可免费体验千问最强模型。


体验地址👇

  • Qwen Chat:https://chat.qwen.ai/

  • 百炼APIhttps://bailian.console.aliyun.com/cn-beijing/?tab=model#/model-market/detail/qwen3-max-2026-01-23

  • 千问APP网页版:https://www.qianwen.com/


# 规模最大、能力最强的千问推理模型


Qwen3-Max-Thinking是目前阿里规模最大、能力最强的千问推理模型,其总参数量超万亿(1T),预训练数据量高达36T Tokens。


此前,预览版Qwen3-Max-Thinking斩获数学推理AIME 25和HMMT 25的国内首个双满分,推理性能已让人惊艳;在此基础上,阿里通义团队进行了更大规模的强化学习后训练,全面提升了正式版Qwen3-Max-Thinking性能。


其中,在涵盖事实知识、复杂推理、指令遵循、人类偏好对齐、Agent能力等19个公认的大模型基准测试中,千问旗舰推理模型刷新了数项最佳表现(SOTA)纪录,整体性能可媲美国际顶尖AI大模型。


# 测试时扩展机制,推理性能提升且更经济


在关键的模型推理能力提升中,千问新模型采用了一种全新的测试时扩展(Test-time Scaling)机制,推理性能提升的同时还更经济。


业界普遍的推理时计算,只会简单增加并行推理路径,重复推导已知结论很常见,冗余推理效率低下;而千问采用的这一机制,可对此前推理的结果进行“经验提取”式的提炼,并据此进行多轮自我迭代,在相同的上下文中实现更高效的推理计算,因此获得更智能的推理结果。


基于这一推理技术创新,千问推理性能和推理效率大为提升,比如在启用工具的“人类最后的测试”HLE中,千问得分58.3,大幅超过GPT-5.2-Thinking的45.5、Gemini 3 Pro的45.8,录得当前所有模型的最高分。


# 大幅增强原生Agent能力,对话时自主调用工具


面向即将到来的智能体Agent时代,Qwen3-Max-Thinking还大幅增强了自主调用工具的原生Agent能力。


这种自适应的工具调用能力可在QwenChat上完整体验,Qwen3-Max-Thinking模型会自主选用「搜索」、「个性化记忆」和「代码解释器」等三个核心的Agent工具功能,提供专业人士一样水平的回答,更合用户心意、更智能、更流畅;同时,模型幻觉也大为降低,为解决真实复杂任务打下基础。


该能力源自于通义团队专门设计的训练流程。具体而言,在完成初步的工具使用微调后,团队对模型进一步在大量多样化任务上进行了基于规则奖励与模型奖励的联合强化学习训练,使得Qwen3-Max-Thinking拥有更智能结合工具进行思考的能力。



/ END /


53AI,企业落地大模型首选服务商

产品:场景落地咨询+大模型应用平台+行业解决方案

承诺:免费POC验证,效果达标后再合作。零风险落地应用大模型,已交付160+中大型企业

联系我们

售前咨询
186 6662 7370
预约演示
185 8882 0121

微信扫码

添加专属顾问

回到顶部

加载中...

扫码咨询