微信扫码
添加专属顾问
我要投稿
经过数月的努力,阿里云今天发布了Qwen2,包括:
5个尺寸的预训练和指令微调模型:Qwen2-0.5B、Qwen2-1.5B、Qwen2-7B、Qwen2-57B-A14B以及Qwen2-72B;
在中文英语的基础上,训练数据中增加了27种语言相关的高质量数据;
多个评测基准上的领先表现;
代码和数学能力显著提升;
增大了上下文长度支持,最高达到128K tokens(Qwen2-72B-Instruct)。
目前,Qwen2已在Hugging Face和ModelScope上同步开源。以下是核心信息:
//
3.Qwen2的下一步是什么?
Qwen团队表示,还在训练更大的模型,继续探索模型及数据的Scaling Law。此外,还将把Qwen2扩展成多模态模型,融入视觉及语音的理解。在不久的将来,还会继续开源新模型。
- end -
53AI,企业落地大模型首选服务商
产品:场景落地咨询+大模型应用平台+行业解决方案
承诺:免费场景POC验证,效果验证后签署服务协议。零风险落地应用大模型,已交付160+中大型企业
2025-06-13
如何像 Manus 交付业务需求-- OneAgent + MCPs 范式
2025-06-13
LLM评估:从原型开发到生产部署的全流程实践(含code)
2025-06-13
拒绝碎片化 RAG,谷歌 DeepMind 推出 ReadAgent:模拟人类阅读长文本,或是NotebookLM底层技术?
2025-06-13
喝点VC|a16z谈搜索大变局:搜索迈入由语言模型主导的“生成式引擎优化(GEO)”全新范式
2025-06-13
Agent工程能力思考记录
2025-06-13
字节跳动2步突破,复杂文档布局解析,为啥如此惊艳?
2025-06-13
Dinox Agent:超越工作流,迎接你的私人 AI 助理
2025-06-13
大模型_搭建工作流(百炼)
2025-05-29
2025-03-20
2025-03-21
2025-03-16
2025-03-16
2025-04-11
2025-03-20
2025-03-19
2025-03-20
2025-03-19
2025-06-13
2025-06-13
2025-06-12
2025-06-12
2025-06-12
2025-06-12
2025-06-12
2025-06-12