微信扫码
添加专属顾问
我要投稿
阿里发布千问最强推理模型Qwen3-Max-Thinking,万亿参数+36T数据训练,性能全面超越国际顶尖AI!核心内容: 1. 模型规模与性能突破:万亿参数、36T Tokens数据训练,刷新19项基准测试纪录 2. 创新测试时扩展机制:实现更经济的推理性能提升,效率远超同类产品 3. 原生Agent能力升级:支持自主调用工具,HLE测试得分全球第一
刚刚,阿里正式发布千问旗舰推理模型Qwen3-Max-Thinking。该模型总参数量超万亿(1T),预训练数据量高达36T Tokens,是目前阿里规模最大、能力最强的千问推理模型。
千问新模型通过总参数、强化学习、推理计算的极致规模扩展,实现了性能的大幅飞跃,在多项关键性能基准测试中刷新全球新纪录。同时,该模型采用全新测试时扩展机制,推理性能提升同时更经济,并大幅增强原生Agent能力,模型对话时可自主调用工具。
目前,开发者可在QwenChat上免费体验Qwen3-Max-Thinking模型,企业可通过阿里云百炼获取新模型API服务,普通用户也可通过千问PC端和网页端试用模型。此外,千问APP也即将接入新模型,所有用户都可免费体验千问最强模型。
体验地址👇
Qwen Chat:https://chat.qwen.ai/
百炼API:https://bailian.console.aliyun.com/cn-beijing/?tab=model#/model-market/detail/qwen3-max-2026-01-23
千问APP网页版:https://www.qianwen.com/
# 规模最大、能力最强的千问推理模型
Qwen3-Max-Thinking是目前阿里规模最大、能力最强的千问推理模型,其总参数量超万亿(1T),预训练数据量高达36T Tokens。
此前,预览版Qwen3-Max-Thinking斩获数学推理AIME 25和HMMT 25的国内首个双满分,推理性能已让人惊艳;在此基础上,阿里通义团队进行了更大规模的强化学习后训练,全面提升了正式版Qwen3-Max-Thinking性能。
其中,在涵盖事实知识、复杂推理、指令遵循、人类偏好对齐、Agent能力等19个公认的大模型基准测试中,千问旗舰推理模型刷新了数项最佳表现(SOTA)纪录,整体性能可媲美国际顶尖AI大模型。
# 测试时扩展机制,推理性能提升且更经济
在关键的模型推理能力提升中,千问新模型采用了一种全新的测试时扩展(Test-time Scaling)机制,推理性能提升的同时还更经济。
业界普遍的推理时计算,只会简单增加并行推理路径,重复推导已知结论很常见,冗余推理效率低下;而千问采用的这一机制,可对此前推理的结果进行“经验提取”式的提炼,并据此进行多轮自我迭代,在相同的上下文中实现更高效的推理计算,因此获得更智能的推理结果。
基于这一推理技术创新,千问推理性能和推理效率大为提升,比如在启用工具的“人类最后的测试”HLE中,千问得分58.3,大幅超过GPT-5.2-Thinking的45.5、Gemini 3 Pro的45.8,录得当前所有模型的最高分。
# 大幅增强原生Agent能力,对话时自主调用工具
面向即将到来的智能体Agent时代,Qwen3-Max-Thinking还大幅增强了自主调用工具的原生Agent能力。
这种自适应的工具调用能力可在QwenChat上完整体验,Qwen3-Max-Thinking模型会自主选用「搜索」、「个性化记忆」和「代码解释器」等三个核心的Agent工具功能,提供专业人士一样水平的回答,更合用户心意、更智能、更流畅;同时,模型幻觉也大为降低,为解决真实复杂任务打下基础。
该能力源自于通义团队专门设计的训练流程。具体而言,在完成初步的工具使用微调后,团队对模型进一步在大量多样化任务上进行了基于规则奖励与模型奖励的联合强化学习训练,使得Qwen3-Max-Thinking拥有更智能结合工具进行思考的能力。
/ END /
53AI,企业落地大模型首选服务商
产品:场景落地咨询+大模型应用平台+行业解决方案
承诺:免费POC验证,效果达标后再合作。零风险落地应用大模型,已交付160+中大型企业
2026-01-26
Claude Skills 与 Gemini Skills 格式对比与转换指南(含示例脚本 + GitHub 项目示例)
2026-01-26
从0到1玩转Clawdbot:我花了40小时,把这些坑都踩完了
2026-01-26
Skills 设计思路分享|一键实现 OneService 接口调用
2026-01-26
3个真实场景 + 5个专业技巧:Claude Code Skills如何重塑你的开发工作流
2026-01-26
如何设计一个AI Agent系统
2026-01-26
突发!OpenAI 明天“发布会”,GPT能再次碾压谷歌 Gemini吗 ?
2026-01-26
深度剖析|Claude Agent 是如何一步步加载 Skill 的?
2026-01-26
深度剖析|Claude Agent 是如何一步步动态加载 skill 的(续)
2026-01-10
2025-11-19
2025-11-13
2025-11-03
2026-01-01
2026-01-24
2025-12-09
2025-11-12
2025-11-15
2025-11-21
2026-01-26
2026-01-26
2026-01-23
2026-01-23
2026-01-22
2026-01-22
2026-01-21
2026-01-21