微信扫码
添加专属顾问
我要投稿
GPT-5-Codex 让代码重构变得轻松高效,体验代理式编程的惊艳效果!核心内容: 1. GPT-5-Codex 在代码审查与重构中的突破性表现 2. 代理式编程如何优化真实工程工作流 3. 升级后的 Codex 产品体验与安全特性
这两天用 gpt-5-codex review + rewrite Noi 代码,效果太惊艳了。我内心真的有点小兴奋,想写一篇文章,但不知道咋写(其实也没啥技巧可言,还需要结合大量项目代码才能聊,与其这样,不如聊点感受)…
我很早就开始用 AI 写代码了,但基本都是完成各种代码片段(一个函数、一个模块等等),这样的代码随着项目迭代不断膨胀,功能点堆砌的感觉会越来越明显(零碎)。如果功能与功能之间没有产生交集,它们各自安好,一旦有了复杂逻辑交互,总会让人觉得哪里抽象不够,哪里又产生了过度耦合。
如果你也有了以上感觉,那可能就需要一个系统级的架构师,来帮你重新规划数据结构、模块功能了。Claude Code 我没订阅过,没啥发言权,但我订阅了 ChatGPT Plus,可以来聊聊使用 Codex 的一些感受。
最近,OpenAI 推出 GPT-5-Codex[1],这是在 GPT-5 基础上专门为“代理式编程”(Agentic coding)优化的版本。它面向真实的软件工程任务训练,既能在与开发者的短互动中快速配对,也能在复杂任务上长时间自主迭代;在内部测试中,模型可连续独立工作数小时,迭代实现、修复测试并完成交付。官方同时把它设为 Codex 云端任务与代码审查的默认模型,并可在本地的 Codex CLI 与 IDE 扩展中选择启用。
如果是复杂任务推荐使用 gpt-5-codex high
,它会调用更多算力。简单任务选择 medium、low 均可,可以获得更快的响应速度:
在能力与评测方面,它对真实工程工作流(从新建项目、加功能与测试、调试到大规模重构和 Code Review)进行了定向优化;模型会依据任务复杂度动态分配“思考时间”:小需求更敏捷,复杂任务思考更久;SWE-bench Verified 由历史的 477 个任务更新为完整的 500 个任务。
此次还同步升级了 Codex 产品体验。CLI 围绕代理式工作流重构,支持在终端里附带截图/线框图以建立共享上下文,内置待办跟踪、Web 搜索与 MCP 工具调用,并提供更清晰的审批模式;IDE 扩展(VS Code/Cursor 等)可利用已打开文件与选中代码作为上下文,在本地与云端之间无缝切换;云端通过容器缓存把新任务与跟进的中位完成时间显著压缩,并能在前端构建时自行开启浏览器查看、回传截图到任务或 PR。
代码审查方面,GPT-5-Codex 会遍历依赖、运行代码与测试以验证意图与实现的一致性。OpenAI 称在内部实践中,大多数 PR 先由 Codex 自动审查,工程师评估显示其评论更聚焦关键问题,减少无效噪音。
安全与可用性上,Codex 默认在本地或云端以禁网沙箱运行,可按需放权:在云端限制信任域名,在 CLI/IDE 中对高风险命令进行审批,也可启用搜索/MCP 等能力。Codex 已包含在 ChatGPT 的 Plus、Pro、Business、Edu 与 Enterprise 订阅中;对通过 API key 使用 CLI 的开发者,GPT-5-Codex 也计划提供 API 接入。
我发现 Codex 很会模仿学习,比如在 Noi 项目中,给出基本 form ui 结构后,要求它使用 zod[2] 完善 save 逻辑,第一版输出在自己实现报错 ui。简单提醒一下,让它使用项目中的 Form 组件,它开始全局检索 Form 使用,然后重写(挺会通过检索项目已有代码来模仿学习)。
它也很会在模糊上下文抓重点,我最喜欢看 thinking 过程了。在项目中,为了方便我有时会临时 hack 一些代码,它能在模糊的提问中找到那些散落在各处的垃圾,不一定全,但建议却很精准。
如果你够细心,应该能看到我在截图中特地展开了一些 thinking。应该也会发现它在高频调用 shell 命令进行关键词检索,这里做个小科普:codex 搜索是用自己实现的 rg 命令(基于 rust 实现),支持字符模糊搜索(可以直接用函数名之类的关键词进行提问)。感兴趣的朋友还可以去看源码 codex-rs/core/src/parse_command.rs[3]。
版本管理很重要,vibe coding 必须要搭配 git 味才对,不然重写几个文件自己就懵逼了。按功能点多次 commit 可以保证它不搞坏正常代码,还可以持续进行优化(一段代码反复 PUA)。之前写代码,我可以做到同时变更大几十个文件不懵逼。但自从 ai 加入后,就感觉脑子转不过来了,尤其是 ai 反复编辑某个功能或文件...
可能是我程序圈关注的比较多,就感觉最近推上 CC(Claude Code) 和 Codex 两大话题讨论度爆表,比如 CC 降智之类的 BUG 都能看到各种刷屏。给我最大的感受:越来越多的普通人开始尝试让自己成为信息焦点,博眼球赚流量…
信息流刷的越多,越有种信息茧房的错觉。信息的冗余复制要远高于创新,看似在爆炸增长,实则营造繁荣假象!
有人说可以让 AI 来帮你筛选,帮你读。但我却认为有些信息还需人来发现、人来读,味才对。我没事喜欢刷推:随机刷帖,随缘收藏。一些信息可能就此吃灰,也可能在未来某时刻与别的东西关联起来,形成新的观点或感受,出现在我的文章或项目里。AI 虽然知识丰富,很会检索,但它不能替我去思考,去感受,也很难跨时空整合我脑子里的东西。
最近还看到前端组件库之争,我想说小孩子才做选择,我全都要。目前在 Noi 项目中,shadcn/ui[4] 与 antd[5] 共存,但它们侧重点有所不同:
这篇文章完全是临时起意,语言可能都没理顺就发了(最真实的感受)。上面的案例并没有回答文章开头提到的“系统级架构师”,但如果你有深度使用过 codex,会发现它的模仿学习、全局检索就是在帮你查漏补缺,系统性的提出建议。网上很多写 hello 或单页 HTML 测评的,都喜欢吹 xxx 更强、更好,我觉得都没啥实际参考价值,只有能帮自己在真实项目中解决问题的 AI 才是好 AI。
注:目前 Noi 的总代码量已经超过 3 万行了,有 300 多个文件(代码统计工具:tokei[6])。
最后再拉个 Vibe coding 交流群吧,欢迎大家积极交流。如果无法扫码,可在公众号私信 “vibe” 获取最新二维码。
如果想私信交流 AI、编程、技术、人生等话题,也可以添加个人微信
GPT-5-Codex:https://openai.com/index/introducing-upgrades-to-codex
[2]zod:https://github.com/colinhacks/zod
[3]codex-rs/core/src/parse_command.rs:https://github.com/openai/codex/blob/main/codex-rs/core/src/parse_command.rs
[4]shadcn/ui:https://github.com/shadcn-ui/ui
[5]antd:https://github.com/ant-design/ant-design
[6]tokei:https://github.com/XAMPPRocky/tokei
53AI,企业落地大模型首选服务商
产品:场景落地咨询+大模型应用平台+行业解决方案
承诺:免费POC验证,效果达标后再合作。零风险落地应用大模型,已交付160+中大型企业
2025-09-18
不只是写代码:Qwen Code 如何规划、执行并验证软件工程任务
2025-09-18
埃森哲:39页,AI 规模化的 “领跑者密码”(免费下载)
2025-09-18
大模型应用落地时的技术选型
2025-09-18
Shopify 经验贴:如何搞出一个生产级别可用的 AI Agent 系统?
2025-09-17
从 AI Agent “尴尬约面故事”:谈如何降低大模型幻觉
2025-09-17
今年“十一”,谁还没带自己的AI讲解搭子?
2025-09-17
GPT-5-Codex 发布,可以7小时连续编程,但OpenAI 封杀了API。。
2025-09-17
超越 Prompt 和 RAG,「上下文工程」成了 Agent 核心胜负手
2025-08-21
2025-06-21
2025-08-21
2025-08-19
2025-07-29
2025-09-08
2025-08-19
2025-08-20
2025-09-14
2025-07-04
2025-09-18
2025-09-17
2025-09-17
2025-09-16
2025-09-14
2025-09-12
2025-09-11
2025-09-11