微信扫码
添加专属顾问
我要投稿
OpenAI重磅开源两款高性能大模型,支持商业应用且性能媲美顶级闭源模型,AI开发者不容错过! 核心内容: 1. GPT-OSS系列模型的突破性技术特点与开源优势 2. 模型在STEM、编程等领域的卓越基准测试表现 3. 开发者友好的部署方案与商业应用前景
大陆时间 2025.8.6 凌晨 3 点左右,OpenAI 发布了gpt-oss-120b
和 gpt-oss-20b
两款性能卓越的轻量级语言模型。他们具备如下特点:
工具调用
、web 搜索、python 代码执行
和结构化输出low/medium/high
3 种推理效果,可根据需求调整简单通过 Ollama 试用了下,效果看起来不错,但超过显示需要订阅。
每个模型都是一个 Transformer,它利用专家混合 (MoE) 来减少处理输入所需的活跃参数数量。gpt-oss-120b 每个令牌激活 51 亿个参数,而 gpt-oss-20b 激活 36 亿个参数。
OpenAI 使用了一个高质量、主要为英文的纯文本数据集对模型进行了训练,重点关注 STEM
、编程
和通用知识领域
。使用了 OpenAI o4-mini 和 GPT‑4o 所用令牌化器的超集进行数据令牌化,即 o200k_harmony
,该令牌化器也一并开源,源代码地址为 https://github.com/openai/harmony
gpt-oss-120b 在竞赛编程 (Codeforces)、通用问题解决 (MMLU 和 HLE) 以及工具调用 (TauBench) 方面表现优于 OpenAI o3‑mini,并与 OpenAI o4-mini 持平或超越其性能。
此外,它在健康相关查询 (HealthBench) 和竞赛数学 (AIME 2024 和 2025) 方面表现得比 o4-mini 更好。尽管 gpt-oss-20b 的规模较小,但在这些相同的评估中,它与 OpenAI o3‑mini 持平或超越后者,甚至在竞赛数学和医疗方面表现得更好。
原生量化为 MXFP4 格式,gpt-oss-120b 模型可在 80 GB 内存中运行,gpt-oss-20b 仅需 16GB 内存。
gpt-oss-120b 面向生产可用场景,可部署在大型数据中心和高端设备上。
gpt-oss-20b 面向设备端应用、本地推理或无需昂贵基础设施的快速迭代的理想选择。
做了大量的优化工作
OpenAI 在设计 gpt-oss 时注重灵活性和易用性
,与领先的部署平台合作:
在硬件方面,与 NVIDIA、AMD、Cerebras 和 Groq 合作确保在各类系统上实现性能优化。希望这些模型能够广泛地为开发者所用。
gpt-oss 虽然不是 OpenAI 最先进的模型,但是它汇聚了 OpenAI 内部前沿的技术理念
、模型架构和训练方法。尤其是强大的智能体能力,支持工具调用、网页搜索、Python 代码调用等,给开发者提供了无限的可能。
gpt-oss 有 2 个参数版本,20b 可在 16G 显存运行,适合普通消费者。120b 可以 80G 显存运行,适合生产环境。
OpenAI 系统 gpt-oss 在加速前沿研究,促进创新,并推动在广泛应用场景下实现更安全、更透明的 AI 开发
53AI,企业落地大模型首选服务商
产品:场景落地咨询+大模型应用平台+行业解决方案
承诺:免费POC验证,效果达标后再合作。零风险落地应用大模型,已交付160+中大型企业
2025-08-06
Agent应用爆发,谁成为向上托举的力量?
2025-08-06
在笔记本上,部署 gpt-oss-120b 模型
2025-08-06
WeKnora:基于大模型的新一代文档理解与检索框架
2025-08-06
OpenAI 为什么要开源大模型 gpt-oss?
2025-08-06
Coze Studio 快速上手指南
2025-08-06
本地部署了一个 gpt-oss:20b,实测同级别感觉还不如deepseek-R1:14b
2025-08-06
企业级 AI 编程神器上线!MonkeyCode:私有部署、安全编程,研发团队加速利器
2025-08-06
OpenAI开源模型一手简单实测
2025-07-23
2025-06-17
2025-06-17
2025-07-23
2025-07-14
2025-07-27
2025-07-12
2025-07-29
2025-07-29
2025-05-29