微信扫码
添加专属顾问
我要投稿
模型技术优势介绍
高质量合成数据:通过使用合成数据增强训练,Hunyuan-Large 可以学习更丰富的表示,处理长上下文输入,并更好地推广到看不见的数据。
KV 缓存压缩:利用分组查询注意(GQA)和跨层注意(CLA)策略显著减少 KV 缓存的内存使用量和计算开销,提高推理吞吐量。
专家特定的学习率缩放:为不同的专家设置不同的学习率,以确保每个子模型有效地从数据中学习并有助于整体性能。
长上下文处理能力:预训练模型支持高达256K的文本序列,Instruct模型支持高达128K,显著增强了处理长上下文任务的能力。
广泛的基准测试:在多种语言和任务上进行大量实验,验证Hunyuan-Large的实用有效性和安全性。
基准评估
与具有相似激活参数大小的 Dense 和 MoE 竞争对手相比, Hunyuan-Large 预训练模型取得了最佳整体性能。
对于 MMLU、MMLU-Pro 和 CMMLU 等聚合基准,Hunyuan-Large 始终取得最佳性能,证实了其在聚合任务上的综合能力。
Hunyuan-Large 在常识理解和推理以及经典 NLP 任务(例如 QA 和阅读理解任务,例如 CommonsenseQA、PIQA 和 TriviaQA)中也表现出色。
对于数学能力,Hunyuan-Large 在 GSM8K 和 MATH 数学数据集上的表现优于所有基线,并且在中文 CMATH 上也获得了最佳结果。Hunyuan-Large 在所有中文任务(例如 CMMLU、C-Eval)中取得了整体最佳性能。
与具有类似激活参数的 LLM 相比,Hunyuan-Large-Instruct在大多数类型的任务上都实现了持续改进,表明了后训练的有效性。
深入研究不同类别基准测试中的模型性能,instruct 模型在 MMLU 和 MATH 数据集上取得了最佳性能。
值得注意的是,在 MMLU 数据集上,模型表现出显着的改进,比 LLama3.1-405B 模型高出 2.6%。
这种增强不仅仅是微不足道的,而是表明 Hunyuan-Large-Instruct 在广泛的语言理解任务中具有出色的理解和推理能力。该模型在 MATH 数据集上的表现进一步凸显了其实力,它比 LLama3.1-405B 明显高出 3.6%。
值得注意的是,这种准确度的飞跃仅通过 520 亿个激活参数就实现了,凸显了模型的效率。
PS:腾讯还开源了一个3D生成大模型。
END.
53AI,企业落地大模型首选服务商
产品:场景落地咨询+大模型应用平台+行业解决方案
承诺:免费POC验证,效果达标后再合作。零风险落地应用大模型,已交付160+中大型企业
2025-12-12
深度解析 Devstral 2:Mistral 如何重新定义开源代码智能体(Agentic Coding)
2025-12-12
【开源推荐】1.4 万星爆火!Notebook LM 开源本地版
2025-12-11
一句 prompt,自动部署 AI 手机|邪修还是快
2025-12-10
豆包手机同款AutoGLM硬核开源:AI如何用“眼睛+大脑+手”接管你手机
2025-12-09
豆包手机不用买了?能操作手机的AutoGLM开源
2025-12-09
今天,AutoGLM开源:让人人都可构建手机Agent
2025-12-09
多模态文档智能解析模型进展-英伟达开源NVIDIA-Nemotron-Parse-v1.1
2025-12-09
11K+ Star!NotebookLM 最强开源平替来了,支持私有化部署!
2025-10-20
2025-11-19
2025-10-27
2025-10-27
2025-10-03
2025-09-17
2025-09-29
2025-10-29
2025-09-29
2025-11-17
2025-11-12
2025-11-10
2025-11-03
2025-10-29
2025-10-28
2025-10-13
2025-09-29
2025-09-17