2026年5月28日 周四晚上19:30,报名腾讯会议了解“如何转型成为前线部署工程师(FDE)”(限30人)
免费POC, 零成本试错
FDE知识库

PDE知识库

学习大模型的前沿技术与行业落地应用


我要投稿

Codex最新更新解读:Goal+Appshots+远程操控,教你榨干Codex的全部潜能

发布日期:2026-05-22 15:03:58 浏览次数: 1514
作者:模智空间

微信搜一搜,关注“模智空间”

推荐语

这篇深度解析教你如何将Codex从编程助手升级为持续运转的工作系统,解锁持久对话、跨应用操控等隐藏潜能。

核心内容:
1. 从一次性对话到持久工作空间的使用习惯转变
2. 利用共享记忆与权限继承实现上下文无缝流转
3. 语音输入与Appshots等新输入方式带来的效率革命

杨芳贤
53AI创始人/腾讯云(TVP)最具价值专家

RAGino="" sans="" microsoft="" data-pm-slice="0 0 []">如果你只用 Codex 写代码,那你大概只用了它三成功力。

这不是夸张。Codex 现在能做的事远不止于此。持久对话、定时自动化、跨应用操控、目标驱动执行。这些功能单个拿出来都不算新鲜,但把它们拼在一起之后,Codex 从一个编程助手变成了一个可以持续运转的工作系统。

就在过去一周,Codex 连续发布更新:Goals 模式全平台正式上线、macOS 截图即送(Appshots)、远程锁屏操控桌面、插件团队共享。这些新功能不是锦上添花,是在补全这套工作流中最关键的几块拼图。

这篇文章不打算逐条介绍功能。我们要拆的是怎么把这些东西组合成一个完整的工作循环。

先把对话从一次性变成长期

大多数人用 Codex 的方式是:打开 → 问一个问题 → 拿到答案 → 关掉。下次再打开,从头来过。

这其实是把 Codex 当搜索引擎用。

持久线程(Durable threads)是第一个需要改的使用习惯。别把每个对话当成一次性的,把它当成一个长期工作空间。维护几个固定线程,每个有固定职责,比如一个线程专门管代码审查,一个盯文档更新,一个管数据监控。Command-1 到 Command-9 能瞬间跳转,切换成本接近零。

但线程持久只是第一步。真正的问题是:上一个线程里积累的上下文,怎么让下一个线程也能用?

答案是共享记忆。别把重要上下文埋在聊天记录里。用一个纯文本文件夹,让 Codex 把关键决策、当前状态、待办事项写成 AgentS.md 文件。下一个对话流启动时直接读这个文件,无缝接手。

举个例子:你在 A 线程里跟 Codex 讨论了项目架构,定了几个技术决策。如果这些决策只留在 A 线程的聊天记录里,B 线程启动时完全不知道。但如果 Codex 把决策摘要写进了 AGENTS.md:后端用 Go 1.24、数据库选 PostgreSQL 17、API 用 gRPC。B 线程启动时读到这行,就可以直接进入状态。

在最新的版本中,权限配置新增了继承机制。什么意思?多个线程可以共享同一套安全策略。以前每个新线程都要重新配一遍允许访问哪些目录、允许执行哪些命令,现在一套配置多个线程共用。

输入方式的三个变化

打字不是唯一跟 Codex 沟通的方式。

语音输入的价值很多人理解错了。快只是一方面,它还能捕捉未经修剪的原始思考。你脑子里刚冒出来的、还没组织成完整句子的想法,说出来就行。

比如:我记得小王在上次会议上提过这事,细节我忘了,你去帮我找找。这种模糊指令对口述来说很自然,打字反而会下意识精炼,过滤掉很多有用的信息。Codex 不需要你给出精确的查询,它自己会去翻 历史记录。

Appshots 是 5 月 21 日桌面应用更新带来的新功能,目前 macOS 专属。同时按下左右两个 Command 键,Codex 会把当前最前方应用的窗口截图和可提取文本一起收进来。你不用截图、保存、上传、描述。Codex 自己看图理解上下文。

BDQSTEZHADQCG

这个功能的价值比表面看起来大得多。以前你想让 Codex 帮你看 Figma 设计稿里的间距对不对,得先截图、保存、拖进对话框。现在两个 Command 键就搞定。你看到一个代码报错,直接按快捷键,Codex 拿到截图和文本,开始排查。

任务干预任务排队也很有用。干预的意思是中途打断 Codex 纠正方向。「停,不要用那个方案,换一个。」比等它跑了五分钟才发现方向偏了高效得多。排队的意思是当前步骤还在跑,先告诉它下一步要干什么。「等这个部署跑完,把链接发给我。」Codex 会把下一步排进队列,不打断当前步骤。

让它自己转:自动化和目标驱动

前面说的都是你主动用它。更有意思的是反过来:它自己运转,你来做最终决定

对话流自动化是这个思路的核心。设置一个定时触发器,让 Codex 每隔固定时间回到同一个线程继续工作。例如,建一个线程让它每15分钟检查一次邮箱的未回复消息,按优先级排序起草回复,但不发送。你回到电脑前的时候,脏活已经干完了。你只需要扫一眼草稿,拍板哪些发送、哪些改一下再发。又或者是每天早 8 点让 Codex 跑到一个数据线程里抓昨天的关键指标,生成一份日报告放在侧边栏里。你起床打开 Codex,报告已经在等你了。

Goals(目标模式)是 5 月 21 日正式化的功能。用户可以在 Codex 应用、IDE 插件或命令行工具(CLI)中使用 /goal 指令,为 Codex 设定一个具体目标,Codex 会自己写代码、自己跑测试、测试不过就修、修完再跑,循环直到目标达成。举个具体例子:你想把一个 Python 模块迁移到 Rust。设目标为「跑通所有原项目的测试用例」。Codex 会自动推进:理解现有代码 → 写 Rust 版本 → 跑测试 → 报错了修 → 再跑 → 直到全绿。遇到死循环或使用限制,Codex之后会自动暂停,不会空转烧 token。

NASSXEZHADQG2

还有一个新功能是远程计算机使用。Mac 锁屏后 Codex 仍可在后台操控桌面应用,通过手机上的 Codex Mobile 远程查看和干预。授权是短时的、屏幕会被覆盖显示、本地任何输入都会触发重锁。

把手伸到代码库之外

Codex 不只能操作代码。它的工具触达范围分三层:

  • $browser:在侧边栏里打开一个内置浏览器,审查网页、看 PR 预览、检查部署状态
  • @chrome:操控你的 Chrome 浏览器,相当于用你的登录态访问各种 web 应用
  • @computer:直接操控桌面 GUI,打开应用、点击按钮、拖拽文件

三层的关系是这样的:$browser 适合快速审查,比如部署完看看页面长什么样。@chrome 适合需要登录的操作,比如在 Jira 里创建工单、在 Notion 里更新文档。@computer 适合任何没有 API 的传统桌面操作,比如打开 Photoshop 调整图片尺寸。

MCP 服务器Skills 是工具层的扩展机制。通过插件市场接外部工具,数据库客户端、云服务 CLI、内部 API。5 月 21 日起 ChatGPT Business 支持插件共享,团队可以把包含技能、MCP 服务器的插件包分发给成员。

还有一个实用的小功能:@mention 统一搜索。输入 @ 之后,一个选择器同时搜索文件、目录、插件和技能。不用记不同搜索入口的快捷键,一个操作搞定。

把侧边栏当做主要工作界面

很多人把侧边栏当成看看 Codex 生成了什么结果的地方。实际上它可以是你最主要的工作界面。

Markdown 笔记、电子表格、PPT、PDF,全在对话框旁边直接审查和标注。Codex 生成的单个index.html 可以直接在侧边栏里变成一个交互式小应用:数据看板、进度追踪器、简单工具界面。

配合 Heartbeats,侧边栏还能定时刷新。比如设一个数据监控线程,每 30 分钟更新一次关键指标,输出到侧边栏的 HTML 页面。你随时切过来看最新数据,不用手动操作任何东西。

出问题了先自检

以前 Codex 出问题只能靠猜。网络不通?认证过期?配置文件写错了?

新增的 codex doctor 命令可以一键诊断运行时、认证状态、终端环境、网络连接、配置文件、本地状态。不用猜哪里出问题了,跑一下 codex doctor,它会告诉你具体哪个环节有异常。

这套方法的适用边界

任何方法论都有自己的适用范围。以下几类场景需要特别注意:

对话流自动化不适合高风险任务。它更适合确定性高、失败成本低的场景,比如检查未回复消息、拉取数据生成报告。不适合「每小时自动处理客户合同」这种任务,一旦出错,代价太高。

长线程有隐形成本。线程越长,上下文越长。内容不在模型缓存窗口里时,单次推理成本比开新线程高。别什么事都往长线程里塞。高频但简单的事情开新线程,低频但需要上下文的才用长线程。

Goals 需要结果可验证。如果你的任务没法定义什么叫完成,Goals 模式就帮不了你。它擅长的是有明确验收标准的工程任务,所有测试通过、所有 CI 检查绿灯、部署成功。开放式探索任务,不太适合。

远程计算机使用有安全考量。锁屏后 Codex 可以操控桌面。这个能力很强大,但也意味着如果你的 Mac 被物理接触到,攻击面比普通锁屏大。评估你的使用场景,别盲目开启。

Codex 的定位一直在变。最开始是终端的 AI 编程助手,然后是支持 IDE 扩展的 AI 编程助手,现在是多端统一的工作底座。持久对话 + 共享记忆 + 多模态输入 + 自动化 + Goals + 工具触达。这六个组件拼在一起,Codex 不再只是你写代码时呼叫的帮手。它变成了一个你可以托付工作流的运行循环。

参考

Getting the most out of Codex — Jason Liu
Codex Github

53AI,企业落地大模型首选服务商

产品:场景落地咨询+大模型应用平台+行业解决方案

承诺:免费POC验证,效果达标后再合作。零风险落地应用大模型,已交付160+中大型企业

联系我们

售前咨询
186 6662 7370
预约演示
185 8882 0121

微信扫码

添加专属顾问

回到顶部

加载中...

扫码咨询