微信扫码
添加专属顾问
我要投稿
OpenAI 2025开发者大会重磅发布,ChatGPT正式进入"应用时代",多模态API与Agent平台将重塑AI生态。核心内容: 1. ChatGPT内置第三方应用功能,实现无缝服务调用 2. 多模态API全面升级,覆盖文本、图像、视频和语音生成 3. 开发者工具包开放,构建ChatGPT生态应用
今天是OpenAI 2025年度发布会,发布了一系列新的玩意。
总结下来,有这么些东西:
可以看出,OpenAI铆足了力气,既把Agent平台(也不算创新)给做了,又提供了非常前沿的全模态API update,涵盖了各个领域,未来的关键词就是Agent、AI编程、模型(其实蛮重要的,应用基座)。
接下来一一解析。
还记得当年微信里第一个小程序上线的惊喜吗? 如今,ChatGPT 也迎来了自己的“小程序时代”——Apps in ChatGPT。
这意味着,你不只是和 ChatGPT 聊天,而是在一个对话里,直接使用 Canva 设计海报、Spotify 创建歌单、Booking.com 订酒店、Coursera 学课程……
「想起了国内的豆包,也啥都能干」
想象一下这样的对话场景👇
Spotify,帮我做一个适合周五派对的歌单。
ChatGPT 自动调用 Spotify,在聊天界面里生成播放列表。
或者:
我下个月想去巴黎玩三天,帮我订个酒店。
ChatGPT 直接打开 Booking.com 的结果卡片,你可以边聊边选房、看图、确认预订。
无需打开任何网页,也不用切换软件。 所有操作,都在聊天中完成。
目前,Apps 功能已面向 所有已登录的 ChatGPT 用户(Free、Go、Plus、Pro 版)开放, 暂不含欧盟地区。
首批上线的合作伙伴包括:
🏨 Booking.com(酒店预订)
🎨 Canva(在线设计)
🎓 Coursera(学习课程)
✈️ Expedia(旅行规划)
🧩 Figma(原型设计)
🎵 Spotify(音乐播放)
🏠 Zillow(房地产)
未来还将陆续上线更多合作方:
如 Uber、Target、Peloton、AllTrails、OpenTable 等。
OpenAI 同时发布了 Apps SDK(开发工具包), 让开发者能轻松创建自己的 ChatGPT 应用。
开发者可以用它:
这套 SDK 基于开放标准 Model Context Protocol (MCP) 构建, 意味着未来这些 App 也可以在任何支持 MCP 的平台运行。
🚀 简单来说:ChatGPT 正在成为一个“对话式操作系统”。
这块,其实国内的扣子做的非常欠缺,对于开发者来说没有激励机制,没有变现机制,生态很难做起来。
OpenAI 计划在今年晚些时候面向开发者启动商业变现机制:
也就是说,未来你不仅可以“用 App”, 还可能“在 ChatGPT 上卖 App”。
过去我们在手机上装应用;未来,我们可能只需一句话。
“帮我设计一张新品发布海报。” —— Canva 立刻上线;
“我想规划一次东京旅行。” —— Expedia 自动出现;
“我想提高英语听力。” —— Coursera 教程一键开启。
ChatGPT 正在变成一个「自然语言驱动的操作系统」: 人人都能通过聊天使用强大的工具和服务。
Apps in ChatGPT = 聊天中的 App Store。
聊天就能订酒店、学课程、做设计、听音乐。未来五年,这将彻底改变我们与 AI、与互联网的交互方式。
AgentKit是一整套全新的工具系统,让开发者和企业能像搭积木一样打造、部署、优化智能体(Agent)。
从“对话式AI”到“可执行AI”,ChatGPT,正在迈向「智能体时代」。
如果说以前做一个智能体要:手动写复杂逻辑、管理版本,然后自己连各种外部工具,接着花几周时间做前端、调试性能;
现在,有了 AgentKit 👉只需要拖拽节点、点几下配置,你就能完成从设计、部署到优化的整个流程。
比如国内版的扣子就是这么整的
它让 AI 从“聪明的聊天对象” ➡ 变成“能干活的数字员工”。
1️⃣ Agent Builder —— 智能体的「可视化大脑」
一个拖拽式画布,让你轻松设计多智能体协作流程。
你可以在上面连接各种模块(判断、搜索、工具调用、对话逻辑), 还能一键测试、版本管理、设置安全规则(防越狱、防隐私泄露)。
💬 实战案例:
Ramp:原本要两个月的智能体开发,只用了两次迭代上线。
LY Corporation(日本科技巨头):两小时就做出办公助理智能体。
✨ 现在,连法务、产品、工程师都能一起上手“编 AI”。
2️⃣ Connector Registry —— 数据与工具的「中控台」
这是企业梦寐以求的东西。
它能统一管理所有数据源与工具连接(如 Dropbox、Google Drive、Teams、SharePoint)。
过去不同部门、不同账号乱成一团(很多企业的通病);
现在,一个控制面板就能搞定所有 API 接入与权限配置。
3️⃣ ChatKit —— 让聊天智能体无缝嵌入产品
ChatKit = 一键嵌入的聊天 UI。
你可以在自己的网站、App、后台系统中嵌入 ChatGPT 风格的智能体对话界面, 流式响应、消息管理、品牌定制全部搞定。
💡 举个例子:
Canva 用 ChatKit 为开发者社区上线了支持智能体的客服,仅用 1 小时集成;
HubSpot、Ramp、Evernote 都已用它打造智能客服和知识助手。
一句话总结:ChatKit 让“对话界面”成为 AI 产品的标配。
OpenAI 同时为开发者强化了智能体评估系统 Evals,新增:
题外话:这不就是扣子罗盘嘛
📁 Datasets:快速创建测试集,自动评分;
🔍 Trace Grading:端到端评估整个智能体工作流;
🧩 Prompt 优化:自动改写提示词,让表现更好;
🧠 强化微调 RFT:让智能体「更懂你」
AgentKit 还支持 强化微调(Reinforcement Fine-Tuning), 让模型能更好地理解你业务的核心逻辑。
目前已在 o4-mini 上全面开放,GPT-5 正在私测中。
ChatKit | ||
Evals 新功能 | ||
Agent Builder | ||
Connector Registry |
全部功能均按标准 API 计费,无额外溢价。
ChatGPT 的下一步,不只是回答问题, 而是能“理解意图、调用工具、完成任务”。
AgentKit 的发布意味着:
OpenAI 表示,未来还将推出:Workflows API(直接部署智能体)、ChatGPT 内置智能体管理,以及支持智能体变现与目录上架的生态计划。
💬 官方原话:
“We can’t wait to see what you build.” —— OpenAI 团队
从今天起,Codex 正式全面开放。
这意味着——你的代码世界,将迎来一位真正懂开发、能协作、会自我进化的智能队友。
1️⃣ Slack 集成:让 Codex 加入你的团队群
只需在 Slack 里 @Codex,它就能:
无论是修 bug、写脚本还是代码 review,它都能直接帮你搞定。
就像一个 24 小时在线的 AI 同事。
2️⃣ Codex SDK:把它嵌入你的工作流
只需几行代码,就能在你的工具或应用中集成 Codex。
目前支持 TypeScript,更多语言即将到来。
无论你在本地终端、云端还是 CI/CD 管线中,Codex 都能无缝协作。
3️⃣ 管理功能升级:更安全、更可控
ChatGPT 工作区管理员现在可以:管理 Codex 环境(编辑、删除)、设置默认安全策略、实时监控使用数据与代码质量。
全新仪表盘 📊 让团队的 AI 协作更透明、更可追踪。
✅ Slack 集成 & Codex SDK
现已向 ChatGPT Plus / Pro / Business / Edu / Enterprise 用户开放。
✅ 新的管理员功能
面向 Business / Edu / Enterprise 计划开放。
从 10 月 20 日起,Codex 云端任务将计入使用量。详细定价请参考官方说明。
使用最新的 Sxxx2(此处,懂得都懂) 模型将视频生成集成到应用程序中。
AI 终于学会「拍视频」了。
OpenAI 最新发布的 Sxxx API,让开发者只用一句自然语言,就能生成带画面、动作、声音的完整视频。
Sxxx 是 OpenAI 最新的多模态视频生成模型。 它能从文字或图片中生成高保真、有节奏、带音频的动态视频。
相比以往的“图像模型”,Sxxx 对 3D 空间感、光影、运动与场景连续性 都有深度理解。
现在,开发者可以直接通过API 调用这些功能👇
1️⃣ 创建视频:输入 prompt,启动视频生成任务
2️⃣ 获取状态:查看生成进度、排队状态
3️⃣ 下载视频:渲染完成后获取 MP4 文件
4️⃣ 列出视频:管理项目历史与素材库
5️⃣ 删除视频:清理无用素材
全流程自动化、可编程。 无论你是做 App、内容平台、短视频工具、还是广告生成引擎, Sora 都能成为核心“AI导演”。
sxxx-2 适合“快出片”,sxxx-2-pro 适合“出大片”。
未来,品牌广告、短片、教育、游戏预告、动画草图…… 都可能由一行文字开始。
如果你以为 GPT-5 已经足够强大,那么 GPT-5 Pro 会让你重新定义「智能模型」。 它不仅能回答问题,更能“思考”问题。
GPT-5 Pro = 更深度推理 × 更稳定输出 × 超长上下文
这是 GPT-5 的高阶版本, 专为需要「严谨思考」和「高精度回答」的场景打造。
🔹 使用更多算力,让模型在回答前真正「思考更久」
🔹 能进行多轮推理、复杂逻辑分析、跨文档理解
🔹 支持长达 40 万上下文窗口
🔹 输出上限高达 27.2 万 tokens
🔹 知识截止:📅 2024 年 9 月 30 日
✨ 专为高推理任务设计
GPT-5 Pro 默认开启最高级别 reasoning 模式(reasoning.effort: high),每一个回答都经过更深层的逻辑演算与验证。
🚫 不支持代码解释器
它不是写代码的那位「Codex」兄弟,而是那个能帮你「分析论文、规划商业方案、审视复杂系统」的智囊。
⚙️ 仅在 Responses API 中提供
为支持更高级的功能——例如多轮模型交互、背景模式执行等。
GPT-5 Pro 适合「一次问很多、输出超长」的深度分析任务
访问:https://platform.openai.com/docs/models/gpt-5-pro
如果你想要 低成本实时 AI 对话,那你一定不能错过 gpt-realtime-mini。
它是 GPT Realtime 的轻量版,让你在 WebRTC / WebSocket / SIP 上轻松实现音频和文字的实时交互。
访问:https://platform.openai.com/docs/models/gpt-realtime-mini
如果你想要 用 AI 快速生成图片,但又想控制成本,gpt-image-1-mini 可以帮你实现!
💡 小提示:gpt-image-1-mini 适合原型设计、快速概念生成和低成本项目测试。
访问:https://platform.openai.com/docs/models/gpt-image-1-mini
未来一片大好,也越来越偏向于应用。
AI发展越快,杀死了很多创业者,没有技术壁垒的创新,终究是时代的尘埃。
下一步应该怎么走,没有答案,或许应用创新值得一试。
对此你怎么看,欢迎交流。
53AI,企业落地大模型首选服务商
产品:场景落地咨询+大模型应用平台+行业解决方案
承诺:免费POC验证,效果达标后再合作。零风险落地应用大模型,已交付160+中大型企业
2025-10-07
ChatGPT 变身 App Store,「对话即应用」时代到了
2025-10-07
Apps inside ChatGPT:OpenAI从“模型卖家”向“平台帝国”的一跃
2025-10-07
在发布 AI 硬件之前,OpenAI 先把 ChatGPT 变成操作系统、支持 MCP
2025-10-07
今天聊一聊Context Engineering
2025-10-07
少即是多:失败步骤比例才是思维链质量的关键
2025-10-07
Anthropic官方站台,颠覆认知:给模型"松绑",它反而更听话
2025-10-07
OpenAI 刚刚发布了「AI 原生版」抖音,还有 Sora 2
2025-10-07
实测腾讯版Claude Code,能微信登陆,还能用GPT5、Claude4和Gemini 2.5 pro御三家
2025-08-21
2025-08-21
2025-08-19
2025-09-16
2025-07-29
2025-09-08
2025-08-19
2025-09-17
2025-09-29
2025-08-20
2025-10-07
2025-10-04
2025-09-30
2025-09-29
2025-09-28
2025-09-27
2025-09-27
2025-09-25