微信扫码
添加专属顾问
我要投稿
OpenAI 推理模型 o3-pro 强势来袭,性能升级引发行业震动。 核心内容: 1. o3-pro 作为 o3 的升级版,推理能力在多领域显著提升 2. 定价策略与性能评测结果,以及对比前代模型的优势 3. o3-pro 的功能限制与在人工智能基准测试中的卓越表现
拖拖拉拉烟雾弹了好几天呐,o3-pro 终于发布了!
先发布后上线,不是等待名单更胜等待名单。
o3-pro 是 OpenAI 今年早些时候推出的推理模型 o3 的一个升级版本。与传统的AI模型不同,推理模型能够一步一步地解决问题,这使其在物理、数学和编程等领域表现得更为可靠。
ChatGPT Pro 和 Team 用户将今天就可以使用 o3-pro,它将取代之前的 o1-pro 模型。
企业版和教育版用户则将在下周获得访问权限,此外,今天下午,o3-pro 也已在 OpenAI 的开发者 API 中上线。
在 API 定价方面,o3-pro 的输入 token 价格为1 Million 20 美元/140 RMB,输出 token 为1 Million 80 美元/560 RMB,一百万输入 token 大约相当于 75 万个单词,比《战争与和平》的篇幅还要稍长一些。
OpenAI 在其更新日志中写道:“在专家评测中,评测人员在所有测试类别中都一致认为 o3-pro 优于 o3(我不是专家,我从名字看起来也认为 i3-por 比 o3 好),尤其是在科学、教育、编程、商业和写作辅助等关键领域。此外,评测人员在清晰度、全面性、指令遵循和准确性方面也给予了 o3-pro 一致更高分。”
据 OpenAI 介绍,o3-pro 能够调用多种工具,使其可以进行网络搜索、分析文件、理解视觉输入、使用 Python 编程、利用记忆功能实现个性化回复等等。但 OpenAI 也提到,该模型的一个缺点是,生成回复所花费的时间通常比 o1-pro 更长。
o3-pro 也存在其他一些限制。由于一个“技术问题”尚未解决,目前在 ChatGPT 中与该模型的临时聊天功能已被禁用。此外,o3-pro 无法生成图像,并且也不支持 OpenAI 的人工智能工作空间功能 Canvas。
不过,从积极的方面来看,根据 OpenAI 的内部测试,o3-pro 在多项流行的人工智能基准测试中取得了令人瞩目的成绩。在评估模型数学能力的 AIME 2024 测试中,o3-pro 的得分超过了谷歌性能顶尖的 AI 模型 Gemini 2.5 Pro。在测试博士级别科学知识的 GPQA Diamond 基准测试中,o3-pro 的表现也优于 Anthropic 公司最近发布的 Claude 4 Opus。
53AI,企业落地大模型首选服务商
产品:场景落地咨询+大模型应用平台+行业解决方案
承诺:免费POC验证,效果达标后再合作。零风险落地应用大模型,已交付160+中大型企业
2026-02-08
【访谈对话】造过 Codex 的人,为什么每天用 Claude Code
2026-02-07
程序员的最后一块拼图:为什么你必须学会用 Claude Code?
2026-02-07
OpenClaw 爆火却难部署?用 Cherry Studio 一键解锁,零门槛打造你的超级 AI Agent
2026-02-06
国产最强 AI 进军终端!Kimi Code CLI 正式发布,让你的命令行直接起飞
2026-02-06
AI记忆正成为新操作系统:检索已过时,生成式记忆才是未来
2026-02-06
简单就是美!Claude Code Ralph循环机制详解
2026-02-06
OpenAI 发布 GPT-5.3-Codex,一文详解
2026-02-06
火拼升级!OpenAI、Anthropic同日发布新模型,一个能替你写代码,一个能替公司管流程
2026-01-24
2026-01-10
2025-11-19
2025-11-13
2026-01-26
2026-01-01
2025-12-09
2025-11-12
2025-12-21
2026-01-09
2026-02-07
2026-02-04
2026-02-03
2026-02-03
2026-02-02
2026-02-02
2026-02-02
2026-01-31