微信扫码
添加专属顾问
我要投稿
OpenAI 推理模型 o3-pro 强势来袭,性能升级引发行业震动。 核心内容: 1. o3-pro 作为 o3 的升级版,推理能力在多领域显著提升 2. 定价策略与性能评测结果,以及对比前代模型的优势 3. o3-pro 的功能限制与在人工智能基准测试中的卓越表现
拖拖拉拉烟雾弹了好几天呐,o3-pro 终于发布了!
先发布后上线,不是等待名单更胜等待名单。
o3-pro 是 OpenAI 今年早些时候推出的推理模型 o3 的一个升级版本。与传统的AI模型不同,推理模型能够一步一步地解决问题,这使其在物理、数学和编程等领域表现得更为可靠。
ChatGPT Pro 和 Team 用户将今天就可以使用 o3-pro,它将取代之前的 o1-pro 模型。
企业版和教育版用户则将在下周获得访问权限,此外,今天下午,o3-pro 也已在 OpenAI 的开发者 API 中上线。
在 API 定价方面,o3-pro 的输入 token 价格为1 Million 20 美元/140 RMB,输出 token 为1 Million 80 美元/560 RMB,一百万输入 token 大约相当于 75 万个单词,比《战争与和平》的篇幅还要稍长一些。
OpenAI 在其更新日志中写道:“在专家评测中,评测人员在所有测试类别中都一致认为 o3-pro 优于 o3(我不是专家,我从名字看起来也认为 i3-por 比 o3 好),尤其是在科学、教育、编程、商业和写作辅助等关键领域。此外,评测人员在清晰度、全面性、指令遵循和准确性方面也给予了 o3-pro 一致更高分。”
据 OpenAI 介绍,o3-pro 能够调用多种工具,使其可以进行网络搜索、分析文件、理解视觉输入、使用 Python 编程、利用记忆功能实现个性化回复等等。但 OpenAI 也提到,该模型的一个缺点是,生成回复所花费的时间通常比 o1-pro 更长。
o3-pro 也存在其他一些限制。由于一个“技术问题”尚未解决,目前在 ChatGPT 中与该模型的临时聊天功能已被禁用。此外,o3-pro 无法生成图像,并且也不支持 OpenAI 的人工智能工作空间功能 Canvas。
不过,从积极的方面来看,根据 OpenAI 的内部测试,o3-pro 在多项流行的人工智能基准测试中取得了令人瞩目的成绩。在评估模型数学能力的 AIME 2024 测试中,o3-pro 的得分超过了谷歌性能顶尖的 AI 模型 Gemini 2.5 Pro。在测试博士级别科学知识的 GPQA Diamond 基准测试中,o3-pro 的表现也优于 Anthropic 公司最近发布的 Claude 4 Opus。
53AI,企业落地大模型首选服务商
产品:场景落地咨询+大模型应用平台+行业解决方案
承诺:免费场景POC验证,效果验证后签署服务协议。零风险落地应用大模型,已交付160+中大型企业
2025-06-12
如何构建T型知识体系,平衡广博与专精?
2025-06-12
做算法备案,对AI企业到底有什么好处?
2025-06-12
Dify实现GIS空间数据问数的一些思考
2025-06-12
【提示词prompt实战教程】用Gemini 2.5 Pro搞定七大产品文档
2025-06-12
Genspark AI 浏览器试用
2025-06-12
AI 智能体到底应该如何构建?分享 Github 上收获 4k stars 的 12 条原则
2025-06-12
如何用大模型自动生成PPT?AutoPresent及SlideCoder方案
2025-06-12
AI的百亿套壳:做船不做柱子
2025-05-29
2025-03-20
2025-03-21
2025-03-16
2025-03-16
2025-04-11
2025-03-20
2025-03-19
2025-03-20
2025-03-19
2025-06-12
2025-06-12
2025-06-12
2025-06-11
2025-06-11
2025-06-11
2025-06-11
2025-06-10