我要投稿

OpenAI开源gpt-oss大模型，本地测试可用性比较高

发布日期：2025-08-07 10:35:27 浏览次数： 1935

作者：极客开源

微信搜一搜，关注“极客开源”

#OpenAI 迫于竞争压力，终于推出了 gpt-oss-120b 和 gpt-oss-20b 两款开源大语言模型，意在与 #DeepSeek 和 #Qwen 争夺开发者生态。这次开源包含开放参数、支持本地部署、兼容链式推理，其中 gpt-oss-120b 的性能接近 o4-mini，并采用 Apache 2.0 许可证支持商用。

可以关注公众号 #极客开源 👆获取最新一手 #AI大模型 #开源项目信息，如果这篇文章对你有用，可以点个“推荐”，听说会影响公众号的 #推荐算法。

模型版本

本次 #开源两个 #MoE 架构的推理模型：

gpt-oss-120b：激活参数量 5.1B，性能更强，可在单张 Nvidia 显卡上运行
gpt-oss-20b：激活参数量 3.6B，更轻量化，甚至可在 16GB 内存的普通笔记本上运行

性能表现

根据 EQBench 评测结果，两个模型分别达到 GPT-4.1-mini 和 GPT-4.1-nano 的水平。在长篇创意写作方面，gpt-oss-120b 接近 Qwen3-30B-A3B 的表现。

在本地环境测试中，gpt-oss-120b 在 Apple M3 Ultra 512G 上大概能以43-45 token/s 运行，这个速度还可以。

技术限制

模型原生上下文长度仅为 4K token，虽然通过 YaRN 位置编码缩放和滑动窗口注意力扩展到了 131,072 token，但超过 4K 后召回性能可能会显著下降。

OpenAI 发布了其开源模型 OSS 系列的#微调教程，由于当前 Expert MXFP4 量化格式的限制，推荐使用 Hugging Face TRL 库进行微调。其他库（如 Unsloth）的兼容性尚待进一步开发。

该教程以 oss-20b 模型为例，展示了如何在模型的系统提示中添加新的“推理语言”选项，并使用多语言推理数据集进行#监督微调。

官方示例在一张 H100 80G 显卡上，使用 1000 条数据进行微调，耗时约 18 分钟。考虑到成本效益，建议用户租用 GPU 资源而非自行购买或使用性能较低的显卡，目前 H100 80G 的租赁成本约为每小时 2 美元。

该教程提供了示例代码，内容精简且易于理解，有助于学习微调技术的实际应用。用户可以快速掌握微调流程。

战略意义

对于 #AI工具开发者而言，这次开源是重大利好，无需担心云端限速、商业闭源或法律风险。OpenAI 的开源策略也将吸引顶级 AI 研究员使用并改进模型，就像 DeepSeek 和 Qwen 通过社区贡献不断迭代优化一样，形成良性的生态循环。

53AI，企业落地大模型首选服务商

产品：场景落地咨询+大模型应用平台+行业解决方案

承诺：免费POC验证，效果达标后再合作。零风险落地应用大模型，已交付160+中大型企业

相关资讯

2025-11-08

GitHub 53k Stars!百度开源的OCR神器,支持80+语言,准确率碾压商业方案!

2025-11-08

别只盯着 DeepSeek，重复输入提示词啦！Kimi 王炸发布 K2 推理模型，能力强大，还支持常用语

2025-11-07

短短几天斩获 17k Star，这个基于 AI 的舆情分析开源项目火了！

2025-11-07

Dify你不知道的秘密：解锁AI应用开发的四大核心技术

2025-11-07

最强开源0.9B级OCR模型！PaddleOCR-VL本地一键部署，私密性拉满【喂饭级教程】

2025-11-07

阿里开源SmartResume，简历解析无需手工

2025-11-06

把任何文档变成Claude的新技能，这个开源工具火了。

2025-11-06

首个AI商业广告工作流开源，我做出了可口可乐最有创意的广告

了解更多

了解更多

160+中大型企业正在使用53AI

立即咨询预约演示

把握AI发展的机遇，共同探索、共同进步

2025-01-22

如何打造基于GenAI的员工服务机器人

2025-01-22

热点资讯

DeepSeek V3.1 Base / Instruct 发布

2025-08-20

阿里Qoder vs Trae vs Cursor：谁才是2025年程序猿的效率之王？

2025-09-07

DeepSeek-V3.1-Base来了！MoE架构+128K上下文，性能再进化

2025-08-20

重磅开源！通义万相最新模型来了

2025-08-26

阿里AI编程 IDE Qoder 正式发布，BAT 终于凑齐了！

2025-08-22

开源发布！适合中国宝宝的 LangGraph 智能体开发模板！

2025-09-06

DeepSeek又开源，这次是OCR模型！附论文解读！

2025-10-20

DeepSeek-V3.1发布，拿下全球开源第一，确实可以封神了！（附一手实测）

2025-08-22

Claude不让用，有哪些国产模型能迎头赶上？

2025-09-08

发现一个超神的Github开源OCR项目，国产多模态杀疯了

2025-10-27

大家都在问

DeepSeek-OCR到底厉害在哪？

2025-11-03

n8n如何调用最近爆火的deepseek OCR？

2025-10-29

小红书入局AI智能体开源DeepAgent，在计划什么更新？

2025-10-28

埃森哲的大裁员，向市场发出了什么信号？

2025-10-13

DeepSeek-V3.2背后的国产算子编程语言TileLang是什么？如何保持性能领先的同时减少6倍代码量？

2025-09-29

Qwen3-Next 首测！Qwen3.5的预览版？但为什么我的测试一塌糊涂？

2025-09-17

Dify Pre-release版本来了，Dify2.0时代不远了，看看有哪些进步？

2025-09-09

Claude不让用，有哪些国产模型能迎头赶上？

2025-09-08

热门标签

内容创作大模型技术个人提效 langchain llamaindex 多模态技术 RAG技术智能客服知识图谱模型微调 RAGFlow coze Dify Fastgpt Bisheng Qanything AI+汽车 AI+金融 AI+工业 AI+培训 AI+SaaS 提示词框架提示词技巧 AI+电商 AI面试数字员工 ChatBI 知识管理开源大模型智能营销智能硬件智能化改造 AI+医疗 MaxKB

应聘简历请发送至： ceo@53ai.com

联系我们

售前咨询

预约演示

微信扫码

添加专属顾问

回到顶部