微信扫码
添加专属顾问
我要投稿
阿里开源QwQ-32B推理模型,以32.5B参数挑战千亿参数模型,实现智能与成本的双重突破。 核心内容: 1. QwQ-32B模型的参数效率革命:32.5B参数量对比671B参数量,降低成本同时保持性能 2. 核心架构创新与性能评测:在特定领域与顶级闭源模型抗衡,数学、编程、通用能力领先 3. 硬件适配与存储优化:FP8兼容架构,动态内存管理,更适合边缘计算部署
GPQA Diamond 评测
QwQ-32B得分 59.5%,显著落后于DeepSeek R1(71%),略逊于Gemini 2.0 Flash(62%)。
AIME 2024评测
QwQ-32B以 78% 的得分反超DeepSeek R1,仅次于一骑绝尘的o3-mini-high模型。
解读:在复杂学术推理(GPQA)上仍有差距,但在医学诊断推理(AIME)中表现亮眼,验证了阿里“轻量高效”的技术路线潜力。
53AI,企业落地大模型首选服务商
产品:场景落地咨询+大模型应用平台+行业解决方案
承诺:免费POC验证,效果达标后再合作。零风险落地应用大模型,已交付160+中大型企业
2025-07-29
智谱放大,源神又启动啦
2025-07-29
GLM-4.5 发布,六大主流模型混战测评,谁能一键生成“ 真·可用 ”的应用?
2025-07-29
Coze既可开源也能本地部署,n8n和coze哪家强?
2025-07-29
开源版 Coze 实测,搭建 Agent,Vibe Coding 都多余了!
2025-07-29
开源 Ai Agent 智能体,能用、能改、能学,美滋滋!
2025-07-29
GLM4.5实测:审美不如R1,全栈还不大可用,别急冲
2025-07-29
一手实测GLM4.5满血版Claude Code,可算有将推理/代码/Agent融为一体的大模型了!
2025-07-29
PPIO上线智谱GLM-4.5:面向推理、代码与智能体的开源SOTA模型
2025-07-23
2025-06-17
2025-06-17
2025-07-23
2025-07-14
2025-07-12
2025-05-29
2025-05-12
2025-05-14
2025-05-20
2025-07-29
2025-07-29
2025-07-28
2025-07-28
2025-07-27
2025-07-27
2025-07-27
2025-07-26