我要投稿

Codex重磅更新：在CLI中语音Vibe Coding

发布日期：2026-03-06 06:52:24 浏览次数： 2941

作者：AI编程实验室

微信搜一搜，关注“AI编程实验室”

熟悉我们号的读者大概能感觉到，我们过去一段时间内，很少单独写Codex和Cursor这两个工具。主要原因是这两个工具不是我日常干活的主力。

但今时不同往日，Codex在GPT-5.3-Codex模型发布之后，并且伴随着执行速度的优化和价格优势，Codex的整体性价比已经超过了Claude Code。

昨天瞎逛到Codex项目的GitHub仓库，才发现，Codex的研发更新迭代是真的猛。不到一天时间，就疯狂更新了多个版本，我昨天才刚刚用上最新的0.105.0版本，今早起来一看，版本号就直接到0.107.0-alpha.2了。

趁着热乎，我把这几次更新的核心内容梳理一下，也顺便聊一下具体的使用体验。

这波更新里我最感兴趣的就是语音输入。

语音输入其实不是啥新鲜事。之前我们借助于第三方工具或者输入法，也能流畅的使用这个功能，比如豆包输入法、闪电说等工具。但这次是CLI工具本身对这个功能的支持，体感上多少还是有点不一样的。

这次Codex CLI直接在终端里内置的语音输入功能，只要按住空格键说话，松开后语音自动转成文字发给模型。那么今后就可以不用打字，对着电脑描述一段需求，Codex就能自动转为文字指令开始干活。Codex应该是目前CLI AI编程工具里第一个内置语音输入能力的。

之前Cursor在IDE里做过语音交互，Codex桌面端App也支持Ctrl+M触发录音。但在纯终端环境里做语音编程，CLI端确实是头一个。对于习惯在终端里干活的开发者来说，这个功能的意义在于你可以一边看代码一边用嘴说需求，手不用离开键盘区域，工作流更连贯。

配置方法很简单，在 ~/.codex/config.toml里加上：

[features]voice_transcription = true

然后重启Codex CLI就能用了。交互方式也很直觉：按住空格键开始录音，说完松开，语音自动转成文字填入输入框。你可以看一眼转录结果，确认没问题直接回车发送，也可以手动修改后再发。整个流程和微信语音转文字的逻辑很像，上手成本基本为零。

这次更新的另一个重头戏是：多智能体系统（Multi-Agents）。

之前Codex CLI对于Agent的功能支持一般，而Claude Code在这方面一直领先，很早就有了subagents的功能，可以让多个Agent并行干活，以及年前更新的Agent teams功能。这次0.105版本开始，Codex CLI终于对Agents功能进行了全面升级，而且一上来就给了不少实用的设计。

开启方式也是改config.toml：

[features]multi_agent = true

或者在CLI里输入 /experimental，手动开启多智能体模式。

需要注意的是，开启多智能体后你用/agent命令并不会立刻看到一堆智能体，默认只有一个Main主智能体。子智能体是模型在执行任务过程中按需动态派生的，你也可以主动要求它分工。

Codex预置了四种角色模板：default（通用型）、worker（执行型，专注写代码改文件）、explorer（分析型，擅长读代码查资料）和monitor（监控型，适合长时间轮询任务）。模型在派生子智能体时会根据任务性质自动选择合适的角色。

这其实跟Claude Code的Agent teams非常像。

每个子智能体还能起昵称，方便区分谁在干什么。比如你可以给一个Agent起名叫frontend，另一个叫backend，通过/agents命令随时查看各个智能体的工作状态和进度。

还有一个挺有意思的功能叫spawn_agents_on_csv。你可以准备一个CSV文件，每一行是一个任务描述，Codex会自动把这些任务分发给多个子智能体并行执行，还带进度条和预计完成时间。这个玩法比较适合批量处理场景，比如批量代码审查、批量文件重构、批量给多个模块写单元测试之类的。

再看一下TUI（终端界面）层面的改进。这些功能单独拿出来都不大，但加在一起，日常使用的体感提升很明显。

0.105加了代码块和diff的语法高亮，终于不用对着一坨纯文本看代码了。还新增了/theme命令，可以实时预览和切换主题配色，支持导入.tmTheme格式的主题文件，亮色和暗色终端都做了适配。对于我这样喜欢纠结配色的主题的人来说，可以算得上是贴心的设计了。

/copy命令也是个小而美的更新，一键复制Codex最新的完整回复到剪贴板。之前想把Codex生成的代码拿出来，得手动选中、复制，碰到长回复还得翻好几屏。现在一个/copy搞定。Ctrl+L清屏也终于来了，关键是清完屏上下文还在，不会丢失聊天记录。

今天更新的0.106版本，内容相对偏底层。加了macOS和Linux的一键安装脚本，降低了上手门槛，不用再折腾npm安装了。内存管理方面引入了diff-based forgetting和usage-aware selection，简单来说就是Codex在长会话中会更聪明地遗忘不重要的上下文，优先保留你最近频繁用到的信息。从经验来看，长会话跑到后面经常会出现AI忘记前面说过什么的情况，这个改进应该能有效缓解这个问题。

其实从这波更新能明显看出来，OpenAI在Codex CLI上的投入力度在加大。24个小时三个版本，语音输入、多智能体、TUI大改，这种更新密度在之前是很少见的。

Codex CLI和Claude Code之间的功能差距正在快速缩小，AI厂商越卷，工具就越好用，对广大开发者来说也是更加利好。

Codex这波更新详细地址：

https://github.com/openai/codex/releases

所以，赶紧更新你的Codex，上手最新版本开始Vibe Coding