微信扫码
添加专属顾问
我要投稿
让 OpenAI 官方来解答:
这是复杂推理任务的重大飞跃,代表了 AI 能力的新高度。我们重置计数器,不再延续 GPT 系列,重命名这一系列为 OpenAI o1。
短短一句话,掀起了全球 AI 界的轩然大波!看来业界又有作业可以参照了。
| 竞赛类型 | GPT-4o 准确率 | o1 预览版准确率 | o1 正式版准确率 | 人类专家平均准确率 |
|---|---|---|---|---|
| AIME 2024 数学竞赛 | 13.4% | 56.7% | 83.3% | - |
| 代码竞赛 | 11.0% | 62% | 89% | - |
| 博士级科学问题 (GPQA Diamond) | 56.1% | - | 78% | 69.7% |
API 调用价格较高,目前有两种型号可供选择:
第一种:o1-preview
o1 预览版,旨在解决跨领域的难题的推理模型。
AI 商业落地,限时注册加入
无论你是 AI 领域的新锐,还是资深的专家,这里都有一个绝佳的平台供你交流分享。我们致力于帮助你在 AI 的广阔天地中打破信息差,中发创意、结识志同道合的合作伙伴、抓住每一个潜在的商业机会。
昱通智联论坛:https://meta.hkyutong.com
评论互动:你觉得 AI 会超越人类吗?
53AI,企业落地大模型首选服务商
产品:场景落地咨询+大模型应用平台+行业解决方案
承诺:免费POC验证,效果达标后再合作。零风险落地应用大模型,已交付160+中大型企业
2026-02-13
跳出英伟达生态:OpenAI 发布新编程模型 GPT-5.3-Codex-Spark,速度达 1000 token每秒
2026-02-13
刚刚Gemini上新模型,全球只有7人比它会编程,谷歌姚顺宇参与
2026-02-13
Agent Skills实操心得:Claude Code篇
2026-02-13
来自MiniMax M2.5的震撼 :小尺寸几乎打平opus4.6,巨便宜,巨能干活,速度巨快
2026-02-12
我给 Claude Code 加装了 MiniMax M2.5:它像“法拉利”,但更像一台工作机
2026-02-12
AgentRun 实践指南:Agent 的宝藏工具——All-In-One Sandbox
2026-02-12
Higress 已支持全新 Gateway API 及其 AI 推理扩展
2026-02-12
GLM-5 发布:从“写代码”到“写工程”的范式跃迁
2026-01-24
2026-01-10
2025-11-19
2026-01-26
2026-01-01
2025-12-09
2025-12-21
2026-01-09
2026-02-03
2026-01-09
2026-02-12
2026-02-12
2026-02-11
2026-02-11
2026-02-11
2026-02-11
2026-02-07
2026-02-04