微信扫码
添加专属顾问
我要投稿
OpenAI Codex 重磅更新,AI编程助手变身“电脑里的搭档”,双击Command即可让AI“看到”你的屏幕,协作效率飙升。 核心内容: 1. Appshots功能:双击Command键让AI截取窗口内容并提取文字,实现无缝上下文传递 2. Goal模式正式上线:AI可自主规划执行复杂任务,支持跨时间持久化与中途调整 3. 锁屏远程操控:Codex能在Mac锁屏状态下继续工作,甚至支持手机远程控制
这次更新最让我眼前一亮的功能。
以前跟 AI 编程助手协作,最烦的是什么?给它上下文。你得把报错截图、复制代码、描述问题……光"喂信息"就花掉一半时间。
Appshots 的解决方式粗暴但管用:在 Mac 上,同时按一下左右 Command 键,Codex 会自动截取当前最前面那个应用窗口的截图 + 提取其中的文字内容,直接塞进对话里。
关键细节:
说白了,这个功能解决的是人机协作里最大的摩擦——上下文传递。与其你费劲描述"我的 Figma 里这个按钮的颜色不对",不如让 AI 直接看一眼。
之前是实验性功能,现在正式上线了,覆盖 Codex 桌面应用、IDE 插件和 CLI 三端。
Goal 模式解决的问题也很明确:有些任务不是一个回合能搞定的。
比如"重构这个模块的认证逻辑",可能需要跨好几个文件,涉及数据库 migration、API 变更、前端适配……传统模式下你得一步步指挥。Goal 模式下,你给 Codex 定一个目标,它会自己规划、自己执行、自己检查,中间你随时可以介入调整方向。
几个实用技巧:
从 Codex CLI 0.133.0 的 changelog 来看,Goal 模式这次是实打实地做了底层重构——有了专门的 Goal 存储数据库,进度跨会话追踪,不再是之前靠上下文窗口"硬记"的土办法。
这个功能有点科幻感——你的 Mac 锁屏了,Codex 还能继续操作桌面应用。甚至可以从手机上的 Codex Mobile 远程操控。
先说 Computer Use 本身。Codex 的 Computer Use 不是简单的远程桌面,而是一套完整的 GUI 操作系统:它能看到屏幕、截图、操作窗口菜单、模拟键盘输入、读取剪贴板。前提是你授予了 macOS 的屏幕录制和辅助功能两项权限。安装方式也很简单——Codex 设置里找到 Computer Use,点 Install,然后按系统提示授权就行。
适用场景很广:
用法也很直觉——在 prompt 里 @Computer 或 @AppName,或者直接说“用 computer use 打开 XX 应用”:
用 computer use 打开应用,复现 onboarding 流程里的 bug, 然后修复导致 bug 的最小代码路径。每次改完后重新跑一遍 UI 流程。
锁屏模式(Locked Computer Use) 是这次的新功能。核心原理:Codex 安装了一个 Apple authorization plug-in,参与 macOS 的解锁流程。
但设计上非常克制——它不是一个通用的远程解锁通道,别人(或其他应用)没法通过这个机制解锁你的 Mac。只有 Codex 在活跃的、受信任的 Computer Use turn 内,才能触发临时解锁。
安全机制做了几层:
几个值得注意的限制:
典型场景:你在公司跑着 Codex 做前端调试,下班锁屏走人。回家路上掏出手机,打开 Codex Mobile 看看进展,甚至远程点两下让它改个配色。人不在电脑前,活照样干。
Codex 内置浏览器做了一波体验优化,重点在"标注"功能:
配合 Chrome 扩展的改进——不再创建标签组(之前很多人吐槽这个),改用标签图标显示状态,Windows 可靠性也修了一波。
对设计师和前端开发者来说,这个更新大幅降低了"说清楚我要什么"的成本。
Business 用户现在可以把自建插件分发给整个团队了。Plugin 里可以包含技能、应用集成和 MCP 服务器。
Enterprise 版本还在路上,但方向很明确:把 Codex 从个人工具变成团队基础设施。团队内部的工具链、代码规范、部署流程,都可以打包成插件统一分发。
这次还给 Business 和 Enterprise 加了更详细的分析面板:
| 维度 | 说明 |
|---|---|
| 活跃用户 | 谁在用、用了多少 |
| Credits 消耗 | Token 用量一目了然 |
| 代码行数 | AI 生成了多少代码 |
| 插件使用率 | 哪些插件最受欢迎 |
| 用户排行榜 | 团队里的 AI 使用达人 |
配合 Analytics API,企业可以把 Codex 用量集成到自己的内部看板。
把这 6 个更新串起来看,一条暗线很清楚:Codex 正在从"代码生成器"变成"开发操作系统"。
Appshots 让 AI 获得了视觉上下文 → Goal 模式让 AI 能长期自主执行 → 锁屏控制让 AI 不受物理位置限制 → 浏览器标注让 AI 理解设计意图 → 插件共享让团队标准化 → Analytics 让管理层看得见 ROI。
每一环都在降低"人指挥 AI"的成本,提高"AI 自主干活"的上限。
当然也有槽点——评论区一堆 Windows 用户在哭,Appshots 和锁屏远程控制目前都是 Mac Only,Chrome 扩展在 Windows 上的稳定性还刚修完。OpenAI 的产品节奏明显跟着苹果生态走,这事儿短期内改不了。
竞争对手方面,Claude Code 同一天发了 2.1.147 更新(Workflow 确定性多智能体编排),Cursor 也在持续迭代。AI 编程赛道的竞争已经从"谁的模型写代码更准"升级到"谁的开发体验更丝滑"——而体验的关键,是减少你描述需求的时间,增加 AI 执行的时间。
53AI,企业落地大模型首选服务商
产品:场景落地咨询+大模型应用平台+行业解决方案
承诺:免费POC验证,效果达标后再合作。零风险落地应用大模型,已交付160+中大型企业
2026-05-22
9 个 Claude Code 插件,让你像多招了一位资深工程师
2026-05-22
Agent核心技术概念与范式发生了哪些演变以及背后的思考
2026-05-21
我用 Qwen 3.7 从 0-1 用 AI 搓了一款武侠 RPG 游戏,绝了!
2026-05-21
Codex 官方分享:如何把 Codex 用到极致
2026-05-21
蚂蚁百宝箱正式发布AI构建能力:自然语言一键生成企业级智能体,助力业务创新提效
2026-05-21
前有用友YonClaw,今有金蝶灵基,中国软件双雄的AI底牌谁能笑到最后?
2026-05-21
Opus 4.7 正在吸收你的 Harness
2026-05-21
阿里云推出「千问.Skills」,一个 Agent 就能调度百炼多模态能力
2026-04-15
2026-04-07
2026-03-31
2026-03-13
2026-03-17
2026-04-07
2026-03-17
2026-03-21
2026-04-24
2026-03-06
2026-05-21
2026-05-19
2026-05-09
2026-05-09
2026-05-09
2026-05-08
2026-05-07
2026-04-26