微信扫码
添加专属顾问
我要投稿
就在5分钟前,OpenAI发布了全新的 AI 模型系列——OpenAI o1,主打推理能力,号称能解决比以往模型更难的科学、编程和数学问题!
先别急着激动,这次只是预览版! OpenAI 表示,o1 系列模型还将进行定期更新和改进,后续还会加入更多功能,例如网页浏览、文件和图像上传等。
推理能力大幅提升: OpenAI 表示,o1 模型在物理、化学和生物等学科的 challenging 基准测试中,表现与博士生相当
数学和编程能力爆表: 在一项国际数学奥林匹克竞赛(IMO)的资格考试中,GPT-4o 的正确率只有 13%,而 o1 模型的正确率高达 83%!在 Codeforces 编程竞赛中,o1 模型的成绩也达到了前 89%!
更像人类一样思考: o1 系列模型经过训练,能够花更多时间思考问题,尝试不同的策略,并识别自己的错误,就像人类一样!
o1 系列模型的安全性:
全新安全训练方法: OpenAI 开发了一种新的安全训练方法,利用 o1 模型的推理能力,让它们更好地遵守安全和对齐准则
更强的“越狱”抵抗力: OpenAI 用“越狱”测试来衡量模型的安全性,结果显示 o1 模型比 GPT-4o 更不容易被“越狱”
科学研究: o1 模型可以帮助医疗研究人员分析细胞测序数据,帮助物理学家生成复杂的数学公式
编程开发: o1 模型可以帮助开发者构建和执行多步骤工作流程。
o1-preview: 预览版模型,功能相对较少,但推理能力强大
o1-mini: 更小、更快的推理模型,特别擅长编程,成本也更低
ChatGPT Plus 和 Team 用户: 现在就可以在 ChatGPT 中使用 o1-preview 和 o1-mini 模型
ChatGPT Enterprise 和 Edu 用户: 下周开始可以使用这两个模型
API 用户: 符合条件的开发者现在就可以在 API 中使用这两个模型,但功能有限,例如不支持函数调用、流式传输、系统消息等
ChatGPT Free 用户: OpenAI 计划在未来向所有 ChatGPT Free 用户开放 o1-mini 模型
继续改进 o1 系列模型, 添加更多功能,例如网页浏览、文件和图像上传等
继续开发 GPT 系列模型, 与 o1 系列模型并行发展
53AI,企业落地大模型首选服务商
产品:场景落地咨询+大模型应用平台+行业解决方案
承诺:免费POC验证,效果达标后再合作。零风险落地应用大模型,已交付160+中大型企业
2025-12-15
治理之智 | 从零和博弈走向长期合作:人工智能版权问题分析与思考
2025-12-15
AgentScope x RocketMQ:打造企业级高可靠 A2A 智能体通信基座
2025-12-15
200k Tokens 的上下文真的够用吗?
2025-12-15
专家知识 x 技术放大:我在B端智能体落地一线的万字真实复盘
2025-12-15
字节AI神操作:AI生成接口自动化测试用例,效率拉满
2025-12-15
解析 Goose:为什么它会进入 AAIF,以及这对 Agentic Runtime 意味着什么
2025-12-15
Palantir的“本体论”:数字世界的底层革命
2025-12-15
Claude Skills|将 Agent 变为领域专家
2025-09-19
2025-10-26
2025-10-02
2025-09-17
2025-09-29
2025-10-07
2025-09-30
2025-11-19
2025-10-20
2025-11-13