我要投稿

ChatGPT Codex，OpenAI的第二款RFT训练的Agent

发布日期：2025-05-18 15:25:17 浏览次数： 2078

作者：孔某人的低维认知

微信搜一搜，关注“孔某人的低维认知”

正当我的ChatGPT续费了Pro会员之后，我感觉只是买了o3和DeepResearch的用量有些不值的时候，OpenAI发布了ChatGPT Codex功能。

Codex功能目前还是Pro会员独享，不知道什么时候能够下放。

基本信息

官方介绍页面：https://openai.com/index/introducing-codex/

Codex的OpenAI官方发布会看了几乎等于没看，没有太多实质性信息。基本就是Codex能干很多，很好，用了端到端RL训练。（不少嘉宾感觉说话都有点不顺溜。不过以PR级别要求开发者和研究员还是太难了，毕竟熟练需要排练，这个时间还是让他们去干活吧。）

Codex是一个云端的AI coding Agent，这点看起来很像是Devin的一个基本版本，不包含渲染前端页面并进行理解、浏览网页之类的，但对于纯代码方面的功能就很符合我对Devin的期待。但它的workspace不能在一个对话session中持久化。而且Codex可以在手机端上访问，享受云端执行的好处。

Codex的整个工作流都是依赖于Github的，包括git repo托管，PR等。

在对话过程中，Codex可以输出对于原始代码的参考引用标记。

Latent Space在一同放了一个Codex的播客，标题叫做《ChatGPT Codex: The Missing Manual》，讲了一些内部设计上的考量。不过对于能力边界什么的感觉也没有提及太多。

ChatGPT Codex: The Missing Manualhttps://www.youtube.com/watch?v=LIHP4BqwSw0

个人使用体验

在一些小任务上感觉Codex很符合的我的期待，感觉比Cursor Agent模式好一些。不过整个流程似乎仍然有些environment的不稳定导致的问题。

但一个限制是，Codex一个任务只能处理一个分支，我研究了半天环境配置，也不能手工指定让它拉取多个分支，不知道是故意为之，还是什么理由。环境配置方面总体感觉做得不太好。智能体运行时互联网访问会被切断，只能在前面环境初始化时访问。理由是出于安全考虑。而我在测试时在初始化时也无法访问，不知道是不是bug。

但总体来说，基于RFT和o3加成的Codex产品让我很有使用它的兴趣。我现在缺的是足够智能的产品。

个人评论

最近新的Code工具不少，Anthropic发了Claude Code，OpenAI发了Codex CLI和Codex（云端）。

而这些工具中，可能唯一使用了RFT/端到端RL的就是Codex。OpenAI的第一个RFT产品Deep Research已经一战成名，所以这次的Codex也很让我期待。

目前体感是，Codex执行挺快的。目前官方限制运行时长是1h，官方在Latent Space播客上同步说经验上困难任务的时间是30min。目前任务并发限制是每小时60个。

说回来，现在OpenAI的Deep Research产品线已经有了三个版本：满血的Deep Research、Deep Research Lite版、o3+Search。最后的o3+Search已经是一个轻量级的Deep Research了，很好用。搜索轮次和探索时间也不少，实际成本应该也明显贵于更简化的方案。