我要投稿

OpenAI 发布新的 Codex 桌面版，我现在不骂 Codex 难用了

发布日期：2026-02-03 18:30:44 浏览次数： 1539

作者：宝玉AI

微信搜一搜，关注“宝玉AI”

Codex 终于有图形界面了。

Codex 是 OpenAI 的 AI 编程助手，之前只有命令行版本。今天 OpenAI 发布了 Codex Desktop App，一款 macOS 桌面应用。我测试了一下，感觉不错。前些天还在吐槽 Codex CLI 难用，现在暂时收回这句话。有了 GUI，操作方便多了，新增的 Skills 和定时任务功能也很实用。

Codex 桌面版是什么

Codex 桌面版是一个图形化界面的 Coding Agent（可以理解为帮你写代码的 AI 助手），但它不止于此，还支持定时任务、Skills 管理和多个 AI 编程 Agent 并行运行。

以前用命令行版，你只能盯着一个终端窗口看它干活。现在可以同时启动好几个 Agent，一个重构认证模块，一个写支付系统的单元测试，第三个处理代码格式问题，它们并行工作，你在一个界面里监控所有进度。

每个 Agent 在独立的 Git 分支上工作，互不干扰。完成后你看 diff、审代码、决定要不要合并。有点像老板，手下有几个 24 小时不睡觉的 AI 初级程序员。

侧边栏可以直接看代码变更记录，不需要专门打开 VSCode 去查看，但编辑还不支持。

定时任务：给自己雇个夜班值班员

定时任务叫 Automations，能让 AI 定期执行一套工程动作，然后把结果交给你审阅。

能用它干什么？扫近期提交找潜在 bug、从合并的 PR 里写 release notes、总结昨天 git 活动给站会、汇总 CI 失败和 flaky tests。OpenAI 内部也拿它做 issue 分流、CI 故障总结、版本发布简报这些"值班活"。

两个关键机制要注意：

本地运行：App 必须开着定时器才会起作用，项目目录必须在本机。暂时不支持云端定时器，不过 OpenAI 说云端支持在路上。

沙盒权限：只读模式下，改文件、联网的调用都会失败；开到 full access 就意味着它能在你电脑上为所欲为，不需要确认就能改东西、跑命令、联网。建议：先手工跑一遍，确认影响范围，再上定时。

另外，定时任务默认用 Git worktree 隔离，不干扰你的主工作区；跑完有发现就进收件箱，没事就自动归档——像给自己雇了个值班同事，只有真的有事才来敲你。

Skills：把团队套路变成可复用的操作卡片

Skills 这词很多产品都用，但 Codex 这套接近"把团队惯例封装成可调用的操作卡片"。

技术上，一个 skill 是一个文件夹，核心是一个带 YAML 元数据的 SKILL.md，再配上可选脚本、参考资料、模板资源。可以理解成：把"怎么做某件事"从聊天记录里抽出来，变成能版本控制、能共享、能复用的标准操作流程。

OpenAI 官方提供了一批现成的 Skills：Figma 技能把设计稿转成代码，Linear 技能帮你管项目，还有 Cloudflare、Vercel、Netlify 这些部署平台的技能，以及读写 PDF、表格、docx 的办公技能。它还有个内置的 Skill Creator，你可以用它教 Codex 怎么用你们公司内部的 API。

据说 OpenAI 内部已经做了几百个自定义技能，拿来跑评测、监控训练、自动写发布说明。

触发方式有两种：显式调用（在提示词里点名 $skill-name）和隐式调用（Codex 根据任务自动判断该用哪个技能）。更关键的是，skills 和定时任务打通了，自动化任务里可以直接写 $skill-name，把"定时做事"变成"定时按标准流程做事"。

和 Claude Code 的差别

Claude Code 是 Anthropic 的 AI 编程产品，早几个月就有了桌面应用（后来改名叫 Cowork），也能跑 remote sessions，关掉 app 也能在云里继续跑。两者都能写代码、都有 GUI，但调度哲学不太一样。

Claude Code 更强调开发者在旁边看着，一步步互动。Codex 则更想让你"撒手"，把任务扔给它，它自己跑完来找你汇报。

几个具体差别：

并行隔离：Codex 把 worktree 做成一等公民，创建线程时直接选 Worktree 模式，自动化任务也默认用后台 worktree 跑。Claude Code 也支持并行，但更像"你先会 Git worktree，然后在每个 worktree 里各跑一个 Claude Code"，是手动拼装的。

自动化落点：Codex 是"桌面内建的定时调度 + 收件箱回报"，贴近个人工作站值班。Claude Code 更偏"事件驱动和 CI"，它有 hooks 可以在编辑、任务结束等节点自动跑 shell 命令，还有 GitHub Actions 集成，把"定时"更多交给 CI 平台。

Skills：两边都基于 Agent Skills 开放标准，都能用"SKILL.md + YAML 元数据"沉淀团队套路。但 Claude Code 在"怎么控制模型何时触发技能、怎么让子代理隔离执行"这块讲得更体系化。

市场层面，据报道 Claude Code 在企业客户里暂时领先，Netflix、Uber、Spotify 都在用。OpenAI 这次免费开放给所有用户试用（限时两个月），同时给付费用户翻倍配额，明显是想抢用户。