我要投稿

OpenAI被开源倒逼，一口气开源2个超级重磅模型GPT-OSS

发布日期：2025-08-06 17:30:00 浏览次数： 1661

作者：硅基心脏

微信搜一搜，关注“硅基心脏”

五年沉寂，一朝破壁。

就在凌晨，OpenAI以GPT-OSS的姿态重返开源战场，一口气开源两个权重语言模型：gpt-oss-120b 和 gpt-oss-20b。

关键信息速读

• 两大模型: 发布gpt-oss-120b与gpt-oss-20b，采用Apache 2.0协议，完全开放商用。
• 性能越级: 120B版本性能直逼o4-mini，20B版本媲美o3-mini，在多个基准测试中展现SOTA（State-of-the-Art）实力。
• 极致效率: 采用MoE架构与原生4位量化（MXFP4），120B模型可在单张80G H100上运行，20B模型仅需16GB显存，消费级硬件即可驾驭。
• Agent友好: 原生支持工具调用、代码执行与结构化输出，为构建强大的AI智能体铺平道路。
• 生态完备: 发布即获Hugging Face、英伟达、微软、Ollama等业界巨头全面支持，部署和微调体验无缝衔接。

五年磨一剑，OpenAI重拾“开放”初心？

距离GPT-2发布已过去五年，当行业几乎将“OpenAI”视为“ClosedAI”的同义词时，它用gpt-oss给出了最强有力的回应。这不仅是自ChatGPT时代以来OpenAI首次开源语言模型，更是一次颠覆性的市场行动。

gpt-oss系列包含两个版本：120B模型面向生产级高推理任务，20B模型则专为低延迟、本地化和边缘计算场景设计。

性能“奇点”：MoE架构与原生量化

GPT-OSS的惊人之处在于，它在保持强大性能的同时，将硬件门槛降至了前所未有的低点。这背后的核心技术，是混合专家（MoE）架构与原生4位（MXFP4）量化方案的精妙结合。

不同于传统模型需要调动全部参数，MoE架构仅激活处理当前任务所需的一小部分“专家”参数。gpt-oss-120b总参数高达1170亿，但每个token仅激活51亿；20B模型则从210亿参数中激活36亿。这种稀疏激活模式是效率的源泉。

更具革命性的是原生量化。OpenAI并非在训练后进行精度压缩，而是在训练阶段就让模型适应低精度环境。这种“出厂即量化”的设计，使得模型体积大幅缩小，性能损失却微乎其微。

最终，一个性能堪比o4-mini的庞然大物，得以在单张80GB显卡上安家；而一个超越众多开源模型的20B版本，仅需16GB显存即可流畅运行。这让高端AI技术真正飞入了寻常开发者的工作站。

SOTA级表现与客观短板

在多个核心基准测试中，GPT-OSS的表现堪称惊艳。无论是在编程竞赛（Codeforces）、通用问答（MMLU），还是在专业领域的健康咨询（HealthBench）和数学竞赛（AIME）上，gpt-oss-120b都展现出与o4-mini分庭抗礼甚至超越的实力。

在同等规模的开源模型对比中，GPT-OSS几乎呈现出碾压性的优势，重新确立了开源SOTA的新标杆。这无疑给所有致力于开源大模型的团队带来了巨大的竞争压力。

然而，作为一款主打推理的纯文本模型，GPT-OSS并非完美。根据社区的初步测试，它在处理某些创意性或复杂代码生成任务时，表现不如顶级闭源模型。同时，其幻觉率也显著高于o3和o4-mini，这是小型化和推理优化过程中难以避免的权衡。

开源是手段，生态是目的

OpenAI此刻选择开源，绝非一时兴起。在以DeepSeek为代表的全球开源力量迅速崛起的背景下，继续固守纯闭源策略已非明智之举。通过开源性能卓越的次顶级模型，OpenAI意在重新夺回开发者心智，巩固其技术生态的护城河。

gpt-oss全面兼容OpenAI的API规范，并原生支持函数调用与代码执行等Agent核心能力。这意味着开发者可以在本地低成本开发、测试和迭代AI应用，成熟后再无缝迁移至OpenAI的付费API，从而形成一个强大的商业闭环。

开放，是为了更深远的掌控。这盘棋，OpenAI下得愈加清晰。

GPT-OSS的发布，与其说是OpenAI的一次慷慨馈赠，不如说是开源力量倒逼下的必然结果。

它为全球开发者拉低了准入门槛，也为整个行业抬高了竞争基线，一个更开放、更激烈的AI新纪元，已然开启。

53AI，企业落地大模型首选服务商

产品：场景落地咨询+大模型应用平台+行业解决方案

承诺：免费POC验证，效果达标后再合作。零风险落地应用大模型，已交付160+中大型企业

相关资讯

2025-11-06

把任何文档变成Claude的新技能，这个开源工具火了。

2025-11-06

首个AI商业广告工作流开源，我做出了可口可乐最有创意的广告

2025-11-06

ChatPPT+魔搭社区：MCP 2.0全面升级！

2025-11-06

AI时代，我们为何重写规则引擎？—— QLExpress4 重构之路

2025-11-06

锦秋基金创始合伙人杨洁揭秘：AI投资三大方向与AI创业者机遇——现场解答最真实的三大创业焦虑

2025-11-05

LLaMA Factory 安装与配置指南：在 Ubuntu 上快速搭建大模型微调平台

2025-11-05

TinyAI ：全栈式轻量级 AI 框架

2025-11-04

百灵大模型 Ling 和 Ring 系列首发支持 SGLang-JAX 推理引擎

了解更多

了解更多

160+中大型企业正在使用53AI

立即咨询预约演示

把握AI发展的机遇，共同探索、共同进步

2025-01-22

如何打造基于GenAI的员工服务机器人

2025-01-22

热点资讯

DeepSeek V3.1 Base / Instruct 发布

2025-08-20

阿里Qoder vs Trae vs Cursor：谁才是2025年程序猿的效率之王？

2025-09-07

DeepSeek-V3.1-Base来了！MoE架构+128K上下文，性能再进化

2025-08-20

重磅开源！通义万相最新模型来了

2025-08-26

阿里AI编程 IDE Qoder 正式发布，BAT 终于凑齐了！

2025-08-22

开源发布！适合中国宝宝的 LangGraph 智能体开发模板！

2025-09-06

DeepSeek又开源，这次是OCR模型！附论文解读！

2025-10-20

DeepSeek-V3.1发布，拿下全球开源第一，确实可以封神了！（附一手实测）

2025-08-22

Claude不让用，有哪些国产模型能迎头赶上？

2025-09-08

智谱发布开源视觉推理模型GLM-4.5V，刷新41项多模态推理SOTA

2025-08-12

大家都在问

DeepSeek-OCR到底厉害在哪？

2025-11-03

n8n如何调用最近爆火的deepseek OCR？

2025-10-29

小红书入局AI智能体开源DeepAgent，在计划什么更新？

2025-10-28

埃森哲的大裁员，向市场发出了什么信号？

2025-10-13

DeepSeek-V3.2背后的国产算子编程语言TileLang是什么？如何保持性能领先的同时减少6倍代码量？

2025-09-29

Qwen3-Next 首测！Qwen3.5的预览版？但为什么我的测试一塌糊涂？

2025-09-17

Dify Pre-release版本来了，Dify2.0时代不远了，看看有哪些进步？

2025-09-09

Claude不让用，有哪些国产模型能迎头赶上？

2025-09-08

热门标签

内容创作大模型技术个人提效 langchain llamaindex 多模态技术 RAG技术智能客服知识图谱模型微调 RAGFlow coze Dify Fastgpt Bisheng Qanything AI+汽车 AI+金融 AI+工业 AI+培训 AI+SaaS 提示词框架提示词技巧 AI+电商 AI面试数字员工 ChatBI 知识管理开源大模型智能营销智能硬件智能化改造 AI+医疗 MaxKB

应聘简历请发送至： ceo@53ai.com

联系我们

售前咨询

预约演示

微信扫码

添加专属顾问

回到顶部