免费POC, 零成本试错
AI知识库

53AI知识库

学习大模型的前沿技术与行业应用场景


一文速览OpenAI Dev Day 2025,下半年开始大洗牌

发布日期:2025-10-07 17:15:37 浏览次数: 1619
作者:AIGC新知

微信搜一搜,关注“AIGC新知”

推荐语

OpenAI 2025开发者大会重磅发布,ChatGPT正式进入"应用时代",多模态API与Agent平台将重塑AI生态。

核心内容:
1. ChatGPT内置第三方应用功能,实现无缝服务调用
2. 多模态API全面升级,覆盖文本、图像、视频和语音生成
3. 开发者工具包开放,构建ChatGPT生态应用

杨芳贤
53AI创始人/腾讯云(TVP)最具价值专家

今天是OpenAI 2025年度发布会,发布了一系列新的玩意。

总结下来,有这么些东西:

  • App in ChatGPT:ChatGPT将第三方APP能力内置为了Agent的工具,自主调用。
  • Agent Kit:OpenAI 复刻了扣子的扣子空间、扣子罗盘、扣子开发平台,工作流仍旧适用,面向开发者。
  • Codex 正式版:对标claude code,更加好用,也就claude那么固步自封了。
  • 多模态API发布:对话GPT-5 Pro、生图gpt-image-1-mini、多模态视频生成Sora、多模态语音对话Real-Time Mini。

可以看出,OpenAI铆足了力气,既把Agent平台(也不算创新)给做了,又提供了非常前沿的全模态API update,涵盖了各个领域,未来的关键词就是Agent、AI编程、模型(其实蛮重要的,应用基座)。

接下来一一解析。

一、ChatGPT 正式进入“应用时代”

还记得当年微信里第一个小程序上线的惊喜吗? 如今,ChatGPT 也迎来了自己的“小程序时代”——Apps in ChatGPT。

这意味着,你不只是和 ChatGPT 聊天,而是在一个对话里,直接使用 Canva 设计海报、Spotify 创建歌单、Booking.com 订酒店、Coursera 学课程……

「想起了国内的豆包,也啥都能干」

💬 什么是「ChatGPT 应用」?

想象一下这样的对话场景👇

Spotify,帮我做一个适合周五派对的歌单。

ChatGPT 自动调用 Spotify,在聊天界面里生成播放列表。

或者:

我下个月想去巴黎玩三天,帮我订个酒店。

ChatGPT 直接打开 Booking.com 的结果卡片,你可以边聊边选房、看图、确认预订。

无需打开任何网页,也不用切换软件。 所有操作,都在聊天中完成。

🧩 谁能用?现在就能!

目前,Apps 功能已面向 所有已登录的 ChatGPT 用户(Free、Go、Plus、Pro 版)开放, 暂不含欧盟地区。

首批上线的合作伙伴包括:

🏨 Booking.com(酒店预订)

🎨 Canva(在线设计)

🎓 Coursera(学习课程)

✈️ Expedia(旅行规划)

🧩 Figma(原型设计)

🎵 Spotify(音乐播放)

🏠 Zillow(房地产)

未来还将陆续上线更多合作方:

如 Uber、Target、Peloton、AllTrails、OpenTable 等。

🧑‍💻 对开发者:Apps SDK 开放预览

OpenAI 同时发布了 Apps SDK(开发工具包), 让开发者能轻松创建自己的 ChatGPT 应用。

开发者可以用它:

  • 定义 App 的界面与逻辑;
  • 连接自有后台或数据库;
  • 支持登录、会员、个性化内容;
  • 让你的 App 在 ChatGPT 内与数亿用户自然对话。

这套 SDK 基于开放标准 Model Context Protocol (MCP) 构建, 意味着未来这些 App 也可以在任何支持 MCP 的平台运行。

🚀 简单来说:ChatGPT 正在成为一个“对话式操作系统”。

💰 未来方向:应用商店 & 变现机制

这块,其实国内的扣子做的非常欠缺,对于开发者来说没有激励机制,没有变现机制,生态很难做起来。

OpenAI 计划在今年晚些时候面向开发者启动商业变现机制:

  • 启动 ChatGPT 应用目录(App Store);
  • 开放 开发者提交与审核机制;
  • 推出 变现功能,并支持「Agentic Commerce Protocol」实现对话内支付。

也就是说,未来你不仅可以“用 App”, 还可能“在 ChatGPT 上卖 App”。

🌍 一个新的时代:ChatGPT = 对话式超级平台

过去我们在手机上装应用;未来,我们可能只需一句话。

“帮我设计一张新品发布海报。” —— Canva 立刻上线;

“我想规划一次东京旅行。” —— Expedia 自动出现;

“我想提高英语听力。” —— Coursera 教程一键开启。

ChatGPT 正在变成一个「自然语言驱动的操作系统」: 人人都能通过聊天使用强大的工具和服务。

Apps in ChatGPT = 聊天中的 App Store。

聊天就能订酒店、学课程、做设计、听音乐。未来五年,这将彻底改变我们与 AI、与互联网的交互方式。

二、AgentKit:积木式搭建智能体

AgentKit是一整套全新的工具系统,让开发者和企业能像搭积木一样打造、部署、优化智能体(Agent)。

从“对话式AI”到“可执行AI”,ChatGPT,正在迈向「智能体时代」。

🧩 一句话讲清楚:什么是 AgentKit?

如果说以前做一个智能体要:手动写复杂逻辑、管理版本,然后自己连各种外部工具,接着花几周时间做前端、调试性能;

现在,有了 AgentKit 👉只需要拖拽节点、点几下配置,你就能完成从设计、部署到优化的整个流程。

比如国内版的扣子就是这么整的

它让 AI 从“聪明的聊天对象” ➡ 变成“能干活的数字员工”。

🔧 三大核心功能,一次性集成 👇

1️⃣ Agent Builder —— 智能体的「可视化大脑」

一个拖拽式画布,让你轻松设计多智能体协作流程。

你可以在上面连接各种模块(判断、搜索、工具调用、对话逻辑), 还能一键测试、版本管理、设置安全规则(防越狱、防隐私泄露)。

💬 实战案例:

Ramp:原本要两个月的智能体开发,只用了两次迭代上线。

LY Corporation(日本科技巨头):两小时就做出办公助理智能体。

✨ 现在,连法务、产品、工程师都能一起上手“编 AI”。

2️⃣ Connector Registry —— 数据与工具的「中控台」

这是企业梦寐以求的东西。

它能统一管理所有数据源与工具连接(如 Dropbox、Google Drive、Teams、SharePoint)。

过去不同部门、不同账号乱成一团(很多企业的通病);

现在,一个控制面板就能搞定所有 API 接入与权限配置。

3️⃣ ChatKit —— 让聊天智能体无缝嵌入产品

ChatKit = 一键嵌入的聊天 UI。

你可以在自己的网站、App、后台系统中嵌入 ChatGPT 风格的智能体对话界面, 流式响应、消息管理、品牌定制全部搞定。

💡 举个例子:

Canva 用 ChatKit 为开发者社区上线了支持智能体的客服,仅用 1 小时集成;

HubSpot、Ramp、Evernote 都已用它打造智能客服和知识助手。

一句话总结:ChatKit 让“对话界面”成为 AI 产品的标配。

📊 评估 + 优化:Evals 新升级,让 AI 更可靠

OpenAI 同时为开发者强化了智能体评估系统 Evals,新增:

题外话:这不就是扣子罗盘嘛

📁 Datasets:快速创建测试集,自动评分;

🔍 Trace Grading:端到端评估整个智能体工作流;

🧩 Prompt 优化:自动改写提示词,让表现更好;

🧠 强化微调 RFT:让智能体「更懂你」

AgentKit 还支持 强化微调(Reinforcement Fine-Tuning), 让模型能更好地理解你业务的核心逻辑。

  • 🧰 Custom Tool Calls:训练模型在正确的时间调用正确工具;
  • 🧾 Custom Graders:定义你自己的评估标准。

目前已在 o4-mini 上全面开放,GPT-5 正在私测中。

💰 开放与定价一览

模块
状态
说明
ChatKit
✅ 已全面开放
所有开发者均可使用
Evals 新功能
✅ 已上线
无额外费用
Agent Builder
🧪 Beta 测试中
面向部分开发者开放
Connector Registry
🧪 Beta 阶段
企业可申请使用(需 Global Admin Console)

全部功能均按标准 API 计费,无额外溢价。

ChatGPT 的下一步,不只是回答问题, 而是能“理解意图、调用工具、完成任务”。

AgentKit 的发布意味着:

  • 对开发者:从“写代码”变成“设计智能流程”;
  • 对企业:从“AI 工具”变成“AI 团队”;
  • 对普通用户:未来你用到的每个智能助理,可能都诞生在 AgentKit 上。

OpenAI 表示,未来还将推出:Workflows API(直接部署智能体)ChatGPT 内置智能体管理,以及支持智能体变现与目录上架的生态计划。

💬 官方原话:

“We can’t wait to see what you build.” —— OpenAI 团队

三、OpenAI Codex:AI编程模型

从今天起,Codex 正式全面开放。

这意味着——你的代码世界,将迎来一位真正懂开发、能协作、会自我进化的智能队友。

✨ 3 大重磅新功能

1️⃣ Slack 集成:让 Codex 加入你的团队群

只需在 Slack 里 @Codex,它就能:

  • 自动理解上下文 🧠
  • 选择合适的环境执行任务 ⚙️
  • 生成结果并返回链接 🔗

无论是修 bug、写脚本还是代码 review,它都能直接帮你搞定。

就像一个 24 小时在线的 AI 同事。

2️⃣ Codex SDK:把它嵌入你的工作流

只需几行代码,就能在你的工具或应用中集成 Codex。

目前支持 TypeScript,更多语言即将到来。

无论你在本地终端、云端还是 CI/CD 管线中,Codex 都能无缝协作。

3️⃣ 管理功能升级:更安全、更可控

ChatGPT 工作区管理员现在可以:管理 Codex 环境(编辑、删除)、设置默认安全策略、实时监控使用数据与代码质量。

全新仪表盘 📊 让团队的 AI 协作更透明、更可追踪。

📈 使用与价格

✅ Slack 集成 & Codex SDK

现已向 ChatGPT Plus / Pro / Business / Edu / Enterprise 用户开放。

✅ 新的管理员功能

面向 Business / Edu / Enterprise 计划开放。

从 10 月 20 日起,Codex 云端任务将计入使用量。详细定价请参考官方说明。

四、支持的多模态模型API

1、Sxxx 2 in the API

使用最新的 Sxxx2(此处,懂得都懂) 模型将视频生成集成到应用程序中。

AI 终于学会「拍视频」了。

OpenAI 最新发布的 Sxxx API,让开发者只用一句自然语言,就能生成带画面、动作、声音的完整视频。

🌌什么是 Sxxx?

Sxxx 是 OpenAI 最新的多模态视频生成模型。 它能从文字或图片中生成高保真、有节奏、带音频的动态视频。

相比以往的“图像模型”,Sxxx 对 3D 空间感、光影、运动与场景连续性 都有深度理解。

⚙️视频 API 开放:5 大能力一次集成

现在,开发者可以直接通过API 调用这些功能👇

1️⃣ 创建视频:输入 prompt,启动视频生成任务

2️⃣ 获取状态:查看生成进度、排队状态

3️⃣ 下载视频:渲染完成后获取 MP4 文件

4️⃣ 列出视频:管理项目历史与素材库

5️⃣ 删除视频:清理无用素材

全流程自动化、可编程。 无论你是做 App、内容平台、短视频工具、还是广告生成引擎, Sora 都能成为核心“AI导演”。

🧠 开放两款模型:速度版 vs 电影版

模型
特点
适合场景
🎞️ Sxxx 2
快速生成、灵活迭代
概念草图、社交视频、内容原型
🎬 Sxxx 2 Pro
高质量输出、细节丰富
影视级画面、品牌广告、营销素材

sxxx-2 适合“快出片”,sxxx-2-pro 适合“出大片”。

未来,品牌广告、短片、教育、游戏预告、动画草图…… 都可能由一行文字开始。

2、GPT-5 Pro in the API

如果你以为 GPT-5 已经足够强大,那么 GPT-5 Pro 会让你重新定义「智能模型」。 它不仅能回答问题,更能“思考”问题。

GPT-5 Pro = 更深度推理 × 更稳定输出 × 超长上下文

⚡️ 什么是 GPT-5 Pro?

这是 GPT-5 的高阶版本, 专为需要「严谨思考」和「高精度回答」的场景打造。

🔹 使用更多算力,让模型在回答前真正「思考更久」

🔹 能进行多轮推理、复杂逻辑分析、跨文档理解

🔹 支持长达 40 万上下文窗口

🔹 输出上限高达 27.2 万 tokens

🔹 知识截止:📅 2024 年 9 月 30 日

🧩 GPT-5 Pro 有何特别?

✨ 专为高推理任务设计

GPT-5 Pro 默认开启最高级别 reasoning 模式(reasoning.effort: high),每一个回答都经过更深层的逻辑演算与验证。

🚫 不支持代码解释器

它不是写代码的那位「Codex」兄弟,而是那个能帮你「分析论文、规划商业方案、审视复杂系统」的智囊。

⚙️ 仅在 Responses API 中提供

为支持更高级的功能——例如多轮模型交互、背景模式执行等。

💵 定价信息

GPT-5 Pro 适合「一次问很多、输出超长」的深度分析任务

模型
输入(/ 1M tokens)
输出(/ 1M tokens)
GPT-5 Pro
💲15.00
💲120.00
o3-Pro
💲20.00
💲—
GPT-5
💲1.25
💲—

访问:https://platform.openai.com/docs/models/gpt-5-pro

3、gpt-realtime-mini

如果你想要 低成本实时 AI 对话,那你一定不能错过 gpt-realtime-mini。

它是 GPT Realtime 的轻量版,让你在 WebRTC / WebSocket / SIP 上轻松实现音频和文字的实时交互。

访问:https://platform.openai.com/docs/models/gpt-realtime-mini

4、gpt-image-1-mini

如果你想要 用 AI 快速生成图片,但又想控制成本,gpt-image-1-mini 可以帮你实现!

💡 小提示:gpt-image-1-mini 适合原型设计、快速概念生成和低成本项目测试。

访问:https://platform.openai.com/docs/models/gpt-image-1-mini

写在最后

未来一片大好,也越来越偏向于应用。

AI发展越快,杀死了很多创业者,没有技术壁垒的创新,终究是时代的尘埃。

下一步应该怎么走,没有答案,或许应用创新值得一试。

对此你怎么看,欢迎交流。

53AI,企业落地大模型首选服务商

产品:场景落地咨询+大模型应用平台+行业解决方案

承诺:免费POC验证,效果达标后再合作。零风险落地应用大模型,已交付160+中大型企业

联系我们

售前咨询
186 6662 7370
预约演示
185 8882 0121

微信扫码

添加专属顾问

回到顶部

加载中...

扫码咨询