微信扫码
添加专属顾问
我要投稿
经过数月的努力,阿里云今天发布了Qwen2,包括:
5个尺寸的预训练和指令微调模型:Qwen2-0.5B、Qwen2-1.5B、Qwen2-7B、Qwen2-57B-A14B以及Qwen2-72B;
在中文英语的基础上,训练数据中增加了27种语言相关的高质量数据;
多个评测基准上的领先表现;
代码和数学能力显著提升;
增大了上下文长度支持,最高达到128K tokens(Qwen2-72B-Instruct)。
目前,Qwen2已在Hugging Face和ModelScope上同步开源。以下是核心信息:
//
3.Qwen2的下一步是什么?
Qwen团队表示,还在训练更大的模型,继续探索模型及数据的Scaling Law。此外,还将把Qwen2扩展成多模态模型,融入视觉及语音的理解。在不久的将来,还会继续开源新模型。
- end -
53AI,企业落地大模型首选服务商
产品:场景落地咨询+大模型应用平台+行业解决方案
承诺:免费POC验证,效果达标后再合作。零风险落地应用大模型,已交付160+中大型企业
2025-09-17
Mem0 + Milvus:为人工智能构建持久化长时记忆
2025-09-17
企业级向量数据库选型,Milvus 和Zilliz Cloud哪个更合适?
2025-09-17
【实践】打造 AI 优先组织,Airtable 的阵痛与新生
2025-09-17
终于有Agent,把刀捅到了老板真正痛的地方。
2025-09-17
阿里发布下一代企业级智能体开发框架AgentScope 1.0
2025-09-17
关于大模型窗口大小的思考——上下文工程和提示词工程
2025-09-16
OpenAI首次揭秘:7亿人到底在用ChatGPT干嘛?
2025-09-16
基于本体论与大模型的新一代智能应用开发体系
2025-08-21
2025-06-21
2025-08-21
2025-08-19
2025-07-29
2025-09-08
2025-08-19
2025-08-20
2025-09-14
2025-07-04
2025-09-17
2025-09-16
2025-09-14
2025-09-12
2025-09-11
2025-09-11
2025-09-09
2025-09-09