微信扫码
添加专属顾问
我要投稿
长话短说
中国时间 6 月 7 日 0 点,Qwen2 开源
包括 0.5B, 1.5B, 7B, 57B-A14B 和 72B
基础信息
训练集除中英文外,额外包括 27 种语言
最多支持 128K(72B 完美支持)
较擅长代码&数学(也是说的 72B)
开源协议
0.5B, 1.5B, 7B, 57B-A14B 使用 Apache 2.0
Qwen2-72B 使用 Qianwen License
Git 地址
https://github.com/QwenLM/Qwen2
Hugging Face
https://huggingface.co/Qwen
在线体验(72B)
https://huggingface.co/spaces/Qwen/Qwen2-72B-Instruct
技术参数
来自官方数据
基础信息
需要额外说的是,在Qwen1.5系列中,只有32B和110B的模型使用了GQA。这一次,所有尺寸的模型都使用了GQA
除了中英文外,还使用了其他 27 种语言的训练数据
在大海捞针里:
72B 和 7B 可处理 128k 上下文
57B-A14B 可处理 64k 上下文
0.5B 和 1.5B 可处理 32k 上下文
测试(72B)
看上去还不错,数据来自官方
测试(7B)
个人认为,这个对比是故意的
53AI,企业落地大模型首选服务商
产品:场景落地咨询+大模型应用平台+行业解决方案
承诺:免费POC验证,效果达标后再合作。零风险落地应用大模型,已交付160+中大型企业
2026-01-30
<span class="js_title_inner">Arber's 碎碎念之2026版</span>
2026-01-30
<span class="js_title_inner">Claude Code 进阶指南:Skills、Subagents 和 MCP,官方文档没写的实战经验</span>
2026-01-30
<span class="js_title_inner">OpenAI o1架构师爆料:AI Scaling已到瓶颈,AGI需要会"自学"的模型</span>
2026-01-30
我们这一生,都在努力传递上下文
2026-01-30
Transformers V5正式发布!这次更新到底香不香?
2026-01-30
反击 OpenAI!谷歌史诗级更新:Gemini in Chrome 正式上线,免费用
2026-01-30
群体智能到来:浅谈Kimi K2.5之Agent Swarm
2026-01-30
Skill 不是 Prompt——从意向性到工程注入的范式转移
2026-01-10
2026-01-24
2025-11-19
2025-11-13
2025-11-03
2026-01-26
2026-01-01
2025-12-09
2025-11-12
2025-11-15
2026-01-30
2026-01-29
2026-01-28
2026-01-28
2026-01-28
2026-01-26
2026-01-26
2026-01-23