我要投稿

Codex 初体验有点小兴奋！

发布日期：2025-09-18 07:17:59 浏览次数： 2043

作者：浮之静

微信搜一搜，关注“浮之静”

这两天用 gpt-5-codex review + rewrite Noi 代码，效果太惊艳了。我内心真的有点小兴奋，想写一篇文章，但不知道咋写（其实也没啥技巧可言，还需要结合大量项目代码才能聊，与其这样，不如聊点感受）…

我很早就开始用 AI 写代码了，但基本都是完成各种代码片段（一个函数、一个模块等等），这样的代码随着项目迭代不断膨胀，功能点堆砌的感觉会越来越明显（零碎）。如果功能与功能之间没有产生交集，它们各自安好，一旦有了复杂逻辑交互，总会让人觉得哪里抽象不够，哪里又产生了过度耦合。

如果你也有了以上感觉，那可能就需要一个系统级的架构师，来帮你重新规划数据结构、模块功能了。Claude Code 我没订阅过，没啥发言权，但我订阅了 ChatGPT Plus，可以来聊聊使用 Codex 的一些感受。

简介

最近，OpenAI 推出 GPT-5-Codex^[1]，这是在 GPT-5 基础上专门为“代理式编程”（Agentic coding）优化的版本。它面向真实的软件工程任务训练，既能在与开发者的短互动中快速配对，也能在复杂任务上长时间自主迭代；在内部测试中，模型可连续独立工作数小时，迭代实现、修复测试并完成交付。官方同时把它设为 Codex 云端任务与代码审查的默认模型，并可在本地的 Codex CLI 与 IDE 扩展中选择启用。

如果是复杂任务推荐使用 gpt-5-codex high，它会调用更多算力。简单任务选择 medium、low 均可，可以获得更快的响应速度：

在能力与评测方面，它对真实工程工作流（从新建项目、加功能与测试、调试到大规模重构和 Code Review）进行了定向优化；模型会依据任务复杂度动态分配“思考时间”：小需求更敏捷，复杂任务思考更久；SWE-bench Verified 由历史的 477 个任务更新为完整的 500 个任务。

此次还同步升级了 Codex 产品体验。CLI 围绕代理式工作流重构，支持在终端里附带截图/线框图以建立共享上下文，内置待办跟踪、Web 搜索与 MCP 工具调用，并提供更清晰的审批模式；IDE 扩展（VS Code/Cursor 等）可利用已打开文件与选中代码作为上下文，在本地与云端之间无缝切换；云端通过容器缓存把新任务与跟进的中位完成时间显著压缩，并能在前端构建时自行开启浏览器查看、回传截图到任务或 PR。

代码审查方面，GPT-5-Codex 会遍历依赖、运行代码与测试以验证意图与实现的一致性。OpenAI 称在内部实践中，大多数 PR 先由 Codex 自动审查，工程师评估显示其评论更聚焦关键问题，减少无效噪音。

安全与可用性上，Codex 默认在本地或云端以禁网沙箱运行，可按需放权：在云端限制信任域名，在 CLI/IDE 中对高风险命令进行审批，也可启用搜索/MCP 等能力。Codex 已包含在 ChatGPT 的 Plus、Pro、Business、Edu 与 Enterprise 订阅中；对通过 API key 使用 CLI 的开发者，GPT-5-Codex 也计划提供 API 接入。

案例

我发现 Codex 很会模仿学习，比如在 Noi 项目中，给出基本 form ui 结构后，要求它使用 zod^[2] 完善 save 逻辑，第一版输出在自己实现报错 ui。简单提醒一下，让它使用项目中的 Form 组件，它开始全局检索 Form 使用，然后重写（挺会通过检索项目已有代码来模仿学习）。

它也很会在模糊上下文抓重点，我最喜欢看 thinking 过程了。在项目中，为了方便我有时会临时 hack 一些代码，它能在模糊的提问中找到那些散落在各处的垃圾，不一定全，但建议却很精准。

📌

如果你够细心，应该能看到我在截图中特地展开了一些 thinking。应该也会发现它在高频调用 shell 命令进行关键词检索，这里做个小科普：codex 搜索是用自己实现的 rg 命令（基于 rust 实现），支持字符模糊搜索（可以直接用函数名之类的关键词进行提问）。感兴趣的朋友还可以去看源码 codex-rs/core/src/parse_command.rs^[3]。

版本管理很重要，vibe coding 必须要搭配 git 味才对，不然重写几个文件自己就懵逼了。按功能点多次 commit 可以保证它不搞坏正常代码，还可以持续进行优化（一段代码反复 PUA）。之前写代码，我可以做到同时变更大几十个文件不懵逼。但自从 ai 加入后，就感觉脑子转不过来了，尤其是 ai 反复编辑某个功能或文件...

📌

可能是我程序圈关注的比较多，就感觉最近推上 CC（Claude Code）和 Codex 两大话题讨论度爆表，比如 CC 降智之类的 BUG 都能看到各种刷屏。给我最大的感受：越来越多的普通人开始尝试让自己成为信息焦点，博眼球赚流量…

信息流刷的越多，越有种信息茧房的错觉。信息的冗余复制要远高于创新，看似在爆炸增长，实则营造繁荣假象！

有人说可以让 AI 来帮你筛选，帮你读。但我却认为有些信息还需人来发现、人来读，味才对。我没事喜欢刷推：随机刷帖，随缘收藏。一些信息可能就此吃灰，也可能在未来某时刻与别的东西关联起来，形成新的观点或感受，出现在我的文章或项目里。AI 虽然知识丰富，很会检索，但它不能替我去思考，去感受，也很难跨时空整合我脑子里的东西。

📌

最近还看到前端组件库之争，我想说小孩子才做选择，我全都要。目前在 Noi 项目中，shadcn/ui^[4] 与 antd^[5] 共存，但它们侧重点有所不同：

shadcn 适合轻量级 UI 交互，美观大方（源码本地化适合高度自定义）
antd 适合复杂逻辑交互，中规中矩（如设置界面，就需要强大的表格表单处理。功能第一，美观其次）

结语

这篇文章完全是临时起意，语言可能都没理顺就发了（最真实的感受）。上面的案例并没有回答文章开头提到的“系统级架构师”，但如果你有深度使用过 codex，会发现它的模仿学习、全局检索就是在帮你查漏补缺，系统性的提出建议。网上很多写 hello 或单页 HTML 测评的，都喜欢吹 xxx 更强、更好，我觉得都没啥实际参考价值，只有能帮自己在真实项目中解决问题的 AI 才是好 AI。

注：目前 Noi 的总代码量已经超过 3 万行了，有 300 多个文件（代码统计工具：tokei^[6]）。