免费POC, 零成本试错
AI知识库

53AI知识库

学习大模型的前沿技术与行业应用场景


不藏了!OpenAI 2025开发者日:ChatGPT要变成操作系统,8分钟拖拽可构建超复杂Agent

发布日期:2025-10-07 04:27:37 浏览次数: 1581
作者:AI寒武纪

微信搜一搜,关注“AI寒武纪”

推荐语

OpenAI开发者日震撼发布:ChatGPT将颠覆操作系统概念,8分钟拖拽即可构建复杂Agent,开启应用开发新纪元!

核心内容:
1. ChatGPT正式进军操作系统领域,推出原生应用构建功能
2. 革命性的AgentKit工具,8分钟拖拽即可开发复杂应用
3. 全新Apps SDK开放预览,支持全栈开发与全球分发

杨芳贤
53AI创始人/腾讯云(TVP)最具价值专家


 

今天OpenAI的开发者日简直太硬核了,OpenAI的开发者已经达到了惊人的400万,ChatGPT周活跃用户达到8亿,每分钟API处理的60亿token


主要有四个方面内容

1.在 ChatGPT 内部构建应用 :Apps inside ChatGPT,OpenAI推出自己的App SDK。这可以说是惊雷消息,OpenAI不但要革苹果Appstore的命,还要直接把ChatGPT变为操作系统,看大神怎么说:

2.直接拖拽构建Agent工具:AgentKit。这里有个8分钟拖拽演示,我把视频扒下来了并且翻译好了,大家直接看视频是最直观的,(可以玩了,链接:https://platform.openai.com/agent-builder/)

3.codex更新,关于codex最新能力演示视频,我也已经扒下来

4.API支持 :sora 2,gpt-5 pro

Apps in ChatGPT:开启一个全新的应用分发与互动生态

我认为这是最震撼的,标志ChatGPT正式进军操作系统,简单来说,OpenAI的野心是以后你只需要一个应用够了,这个应用就是ChatGPT,这样ChatGPT就变成事实上操作系统了,苹果Appstore瑟瑟发抖,毫无疑问这是OpenAI战略性的赌注

在过去,OpenAI 曾尝试通过 GPTs 和 MCP 等方式,将开发者的服务与 ChatGPT 连接起来。这些尝试有的成功,有的则不尽人意,但都为 OpenAI 积累了宝贵的经验。今天,OpenAI 迈出了决定性的一步,正式向开发者开放 ChatGPT,允许他们在其中构建原生应用 (Apps)

这将催生新一代的应用形态,它们具备三大核心特质:互动性 (interactive)、适应性 (adaptive) 和个性化 (personalized)。用户不再是单纯地与一个聊天机器人对话,而是可以直接在对话中与功能丰富的应用进行交互。为了实现这一点,OpenAI 推出了全新的 Apps SDK (软件开发工具包),现已开放预览

Apps SDK 为开发者提供了一套完整的全栈解决方案,其主要特性包括:

连接数据:开发者可以将自己的数据源和后端服务无缝接入

触发动作:应用可以执行具体的后端操作,例如创建一个设计、预订一个行程或分析一份数据

渲染完整 UI:开发者可以在 ChatGPT 的对话流中渲染完全互动的用户界面,而不仅仅是文本或卡片。这意味着视频播放器、互动地图、设计画板等复杂的 UI 都可以被直接嵌入

基于 MCP 标准:Apps SDK 建立在 MCP 这一开放标准之上,开发者对其后端逻辑和前端 UI 拥有完全的控制权。由于标准是公开的,任何人都可以将其整合到自己的平台

对于开发者而言,最大的吸引力在于分发渠道。一旦应用构建完成,它就有机会触及 ChatGPT 全球数亿的用户群体。这将极大地改变产品的规模化扩展方式。同时,OpenAI 也考虑到了商业化的需求。如果用户已经是开发者现有产品的订阅者,他们可以直接在对话中登录账户。未来,OpenAI 还将支持多种变现方式,包括新的Agentic Commerce Protocol (智能体商业协议),该协议将允许在 ChatGPT 内部实现即时结账

在现场演示中,软件工程师 Alexi 展示了几个首批合作伙伴的应用,生动地诠释了这种新模式的魔力:

Coursera (在线课程平台):当用户想要学习某个主题时,可以直接呼叫 Coursera 应用。应用会在对话中直接嵌入课程视频,并支持画中画或全屏播放。与应用对话功能:当用户观看视频时,可以随时向 ChatGPT 提问关于视频当前内容的问题,例如“请解释一下他们现在正在说的概念”。由于 Apps SDK 允许应用将上下文 (context) 暴露给模型,ChatGPT 能够准确理解用户正在观看的视频片段,并给出精准的回答。这将学习体验提升到了全新的高度

Canva (设计平台):在一个为宠物狗遛弯业务进行头脑风暴的对话中,用户可以直接呼叫 Canva,并用自然语言下达指令,例如“Canva,用这个名字为我制作一个作品集,我希望它色彩丰富、异想天开、明亮,并使用无衬线字体”。Canva 应用会直接在对话中生成设计选项。用户还可以进一步迭代,比如将一张海报转化为一个用于种子轮融资的完整 Pitch Deck (简报)。整个创意流程在同一个对话窗口中无缝完成

Zillow (房地产平台):当对话延伸到业务扩张,ChatGPT 建议将新城市选在匹兹堡。用户可以接着呼叫 Zillow 应用,要求“显示那里的待售房屋”。Zillow 会在对话中嵌入一个互动地图。用户可以切换到全屏模式,浏览房屋详情,甚至可以直接在地图上发起预约看房。更强大的是,用户可以继续用自然语言对 Zillow 应用进行操作,例如“将地图筛选为仅显示带院子的三居室房屋”。ChatGPT 会理解指令并更新地图。此外,当用户选定一处房产时,可以询问“这处房产离狗狗公园有多远?”。ChatGPT 会将来自 Zillow 应用的房屋位置信息与其自身的搜索工具结合,提供综合性的答案

这些演示清晰地表明,Apps in ChatGPT 不仅仅是 API 的简单调用,而是将语言模型的理解能力与应用的丰富功能和互动界面深度融合,创造出前所未有的动态体验

目前,Apps SDK 已向开发者提供预览版。今年晚些时候,开发者将能够提交应用进行审核和发布,届时还会推出一个应用目录 (Directory) 供用户浏览。符合基本标准的应用都将被收录,而那些在设计和功能上表现更出色的应用,将会获得更显著的推荐位置,甚至在对话中被主动建议给用户

https://developers.openai.com/apps-sdk

AgentKit:在几分钟内将智能体从原型带入生产环境

智能体 (Agent),即能够理解上下文、使用工具并自主完成任务的软件,被普遍认为是 AI 的下一个重要发展方向。然而,尽管围绕它的讨论非常火,但真正能投入生产并被大规模使用的智能体却寥寥无几。原因在于其开发过程异常复杂,开发者需要处理诸多难题:从选择合适的框架,到编排复杂的工作流、建立评估循环、连接各种工具,再到构建一个友好的用户界面,每一步都充满了挑战

为了解决这些痛点,让每位开发者都能更快速地将想法转化为可用的智能体,OpenAI 推出了全新的 AgentKit。这是一套内置于 OpenAI 平台中的完整构建模块,旨在帮助开发者以更少的时间和精力,完成从原型设计到生产部署的全过程

AgentKit 核心包含三大组件,以及一个强大的连接器生态系统:

1.Agent Builder (智能体构建器):这是一个可视化的工作流设计工具。开发者不再需要从头编写复杂的协调代码,而是可以通过拖拽节点的方式来设计智能体的逻辑步骤、测试流程。这些节点包括工具调用、需要人类介入的环节、安全护栏和逻辑判断等。它建立在已有数十万开发者使用的 Responses API 之上,对于平台老用户来说非常容易上手

2.ChatKit (聊天工具包):为了让智能体拥有一个精美的用户界面,OpenAI 提供了 ChatKit。它是一个简单、可嵌入的聊天界面组件,开发者可以轻松地将其集成到自己的应用中,并进行品牌化定制,例如修改颜色、Logo 和提示语。这让开发者可以专注于核心业务逻辑,而无需在前端界面上花费过多时间

3.Evals for Agents (智能体评估):衡量智能体的性能至关重要。AgentKit 提供了一套专门的评估功能,包括:

Trace Grading (追踪评分):可以逐一审视智能体每一步的决策过程,深入理解其行为

Datasets (数据集):允许开发者针对工作流中的某个特定节点进行性能评估

Automated Prompt Optimization (自动化提示优化):帮助自动调整和改进提示词,以获得更好的性能

External Model Evals (外部模型评估):甚至支持在 OpenAI Evals 平台内直接对外部模型进行评估

Connector Registry (连接器注册中心):智能体需要安全地访问数据和工具。通过这个管理控制面板,企业可以安全地将智能体连接到内部工具和第三方系统,同时确保数据安全和权限可控

现场演示,Christina 发起一项挑战:在 8 分钟内为 DevDay 的官方网站构建并部署一个问答智能体 "Ask Froge"

我已经贴心的把这8分钟视频扒下来了,并且做好的翻译,大家就看吧,不用感谢我

设计工作流 (在 Agent Builder 中)

1.  她首先拖入一个分类器节点,用来判断用户的提问是关于“会议日程”还是“一般信息”。
2.  接着,她创建了两个专门的智能体节点。一个是“日程智能体”,为其上传了包含所有会议信息的文档作为知识源;另一个是“DevDay 通用智能体”,为其提供了通用信息文件,并设定了其角色风格(像一只名为 Froge 的青蛙一样说话,会发出 "ribbit" 的声音)。
3.  为了让日程推荐更具视觉吸引力,她使用 **Widget Builder (小组件构建器)** 设计了一个精美的日程卡片,并将其附加到“日程智能体”的输出格式中。
4.  为了增强安全性,她添加了一个预置的 **Guardrail (护栏)** 节点,用于自动屏蔽个人身份信息 (PII)。
5.  整个工作流设计完成后,她在 Agent Builder 的预览窗口中进行了测试,确认其能够正确回答问题并以预期的方式呈现结果。

部署到网站

1.  她点击“发布”,AgentKit 为这个工作流生成了一个唯一的 ID。
2.  然后,她来到 DevDay 网站的代码中,仅用了几行代码就完成了部署:她引入了 **ChatKit** 的 React 组件,将刚刚生成的工作流 ID 传入,并添加了一些自定义样式,如 Froge 主题的颜色和提示语。
3.  刷新网站,一个名为 "Ask Froge" 的聊天机器人已经出现在页面右下角,并完全可用。

整个过程从设计到部署,耗时不到 8 分钟。这个演示完美地展示了 AgentKit 如何将一个原本需要数周开发时间的复杂任务,缩短到几分钟。更重要的是,后续的迭代可以直接在可视化的 Agent Builder 中完成,修改后的智能体无需重新部署代码即可在网站上生效

Codex

Codex更新

今天,Codex 正式结束研究预览,进入通用可用阶段。推出了一系列新功能:

1.Slack 集成:开发者可以直接在 Slack 的团队对话中要求 Codex 编写代码或回答问题

2.Codex SDK:一个新的开发工具包,帮助团队将 Codex 的能力扩展和自动化到自己的工作流中

3.新的管理工具和报告:包括环境控制、监控和分析仪表板,帮助企业更好地管理 Codex 的使用

现场演示codex强大的编程能力: Romain 展示了如何利用 Codex 和 OpenAI 的 API,将周围的物理世界变成可交互的软件

同样给大家奉上演示视频全过程:


**从草图到 UI**:Romain 首先展示了一张他手绘的 UI 草图,然后使用 `Codex CLI` (命令行工具) 将其转换成一个带有摄像头画面的控制面板界面

**控制物理设备**:他的第一个挑战是发布会控制舞台上方的 Sony FR7 摄像机。他对如何开始一无所知,只知道这款摄像机有一个 C++ SDK。他直接向 Codex 下达了任务,Codex 自主研究了有 30 年历史的 VISCA 协议,并用 JavaScript 实现了控制逻辑。Romain 强调,Codex 能够不知疲倦地执行长达数小时的复杂任务

**实时添加新功能**:接着,Romain 在 VS Code 中向 Codex 插件下达了一个新任务:“将一个无线控制器连接起来以控制摄像机”。Codex 在后台开始分析现有代码,制定计划并实现功能。几分钟后,Romain 拿起一个 Xbox 手柄,成功地控制了摄像机的移动

**多模态与多工具协作**:演示的高潮是引入了语音控制。他利用 OpenAI 的实时语音 API 和 Agent SDK,为应用添加了语音交互能力。然后,他向 Codex 发出指令,要求为舞台的灯光系统创建一个 MCP 服务器,并提供了灯光系统的参考文档。Codex 在执行任务时,发现文档信息不全,于是自主上网搜索 GitHub 上的文档,补全了所需信息,最终成功创建了服务器

**人机协同编程的未来**:演示的最后,Romain 通过语音向应用下达指令:“让 Codex 显示一个类似电影结尾的演职员表,演员是现场的观众们”。应用中的语音智能体将这个请求转发给了 **Codex SDK**。Codex 实时地分析了前端应用的代码,注入了新的 React 组件,并在屏幕上滚动显示出了“演职员表”

这个现场演示展示codex开发全过程:从草图、物理设备、语音指令到实时应用重构,整个过程几乎没有手写一行代码。Codex 真正成为了一位能够理解意图、解决未知问题并与开发者并肩工作的智能队友

模型与 API 更新

GPT-5 Pro API 开放

GPT-Realtime-Mini API 开放

Sora 2 API 预览版发布

写在最后

DevDay 2025 的所有发布都指向一个共同的目标:OpenAI要为为这个新的开发者时代提供最好的平台。从在 ChatGPT 内部分发应用的 Apps SDK,到简化智能体开发的 AgentKit,再到 Codex,以及 GPT-5 Pro、Sora 2 和 Realtime-Mini 等更强大的模型 API,OpenAI 正在全方位地为开发者赋能

就像Sam Altman说的,软件开发曾经是一个需要数月甚至数年才能完成的漫长过程,但今天,我们亲眼见证了它可以在几分钟内完成。在这个新时代,你所需要的,仅仅是一个好的想法。

这是一个属于所有新开发者的黄金时代,注意是新开发者,我们都要问自己一句,我们属于这个新行列吗?

以上,谢谢你看我的文章。觉得还不错的话,点个赞/在看/转发就更好了~想第一时间收到更新,记得给我加个⭐星标。~我们,下次再见
.../作者:花不玩

 

53AI,企业落地大模型首选服务商

产品:场景落地咨询+大模型应用平台+行业解决方案

承诺:免费POC验证,效果达标后再合作。零风险落地应用大模型,已交付160+中大型企业

联系我们

售前咨询
186 6662 7370
预约演示
185 8882 0121

微信扫码

添加专属顾问

回到顶部

加载中...

扫码咨询