微信扫码
添加专属顾问
我要投稿
Codex CLI重磅升级,语音编程与多智能体系统让开发者效率翻倍! 核心内容: 1. CLI内置语音输入功能,实现真正的"动口不动手"编程 2. 多智能体系统全面升级,支持并行任务处理 3. 配置简单直观,与现有工作流无缝衔接
大家好,我是鲁工。
熟悉我们号的读者大概能感觉到,我们过去一段时间内,很少单独写Codex和Cursor这两个工具。主要原因是这两个工具不是我日常干活的主力。
但今时不同往日,Codex在GPT-5.3-Codex模型发布之后,并且伴随着执行速度的优化和价格优势,Codex的整体性价比已经超过了Claude Code。
昨天瞎逛到Codex项目的GitHub仓库,才发现,Codex的研发更新迭代是真的猛。不到一天时间,就疯狂更新了多个版本,我昨天才刚刚用上最新的0.105.0版本,今早起来一看,版本号就直接到0.107.0-alpha.2了。
趁着热乎,我把这几次更新的核心内容梳理一下,也顺便聊一下具体的使用体验。
这波更新里我最感兴趣的就是语音输入。
语音输入其实不是啥新鲜事。之前我们借助于第三方工具或者输入法,也能流畅的使用这个功能,比如豆包输入法、闪电说等工具。但这次是CLI工具本身对这个功能的支持,体感上多少还是有点不一样的。
这次Codex CLI直接在终端里内置的语音输入功能,只要按住空格键说话,松开后语音自动转成文字发给模型。那么今后就可以不用打字,对着电脑描述一段需求,Codex就能自动转为文字指令开始干活。Codex应该是目前CLI AI编程工具里第一个内置语音输入能力的。
之前Cursor在IDE里做过语音交互,Codex桌面端App也支持Ctrl+M触发录音。但在纯终端环境里做语音编程,CLI端确实是头一个。对于习惯在终端里干活的开发者来说,这个功能的意义在于你可以一边看代码一边用嘴说需求,手不用离开键盘区域,工作流更连贯。
配置方法很简单,在 ~/.codex/config.toml里加上:
[features]voice_transcription = true
然后重启Codex CLI就能用了。交互方式也很直觉:按住空格键开始录音,说完松开,语音自动转成文字填入输入框。你可以看一眼转录结果,确认没问题直接回车发送,也可以手动修改后再发。整个流程和微信语音转文字的逻辑很像,上手成本基本为零。
这次更新的另一个重头戏是:多智能体系统(Multi-Agents)。
之前Codex CLI对于Agent的功能支持一般,而Claude Code在这方面一直领先,很早就有了subagents的功能,可以让多个Agent并行干活,以及年前更新的Agent teams功能。这次0.105版本开始,Codex CLI终于对Agents功能进行了全面升级,而且一上来就给了不少实用的设计。
开启方式也是改config.toml:
[features]multi_agent = true
或者在CLI里输入 /experimental,手动开启多智能体模式。
需要注意的是,开启多智能体后你用/agent命令并不会立刻看到一堆智能体,默认只有一个Main主智能体。子智能体是模型在执行任务过程中按需动态派生的,你也可以主动要求它分工。
Codex预置了四种角色模板:default(通用型)、worker(执行型,专注写代码改文件)、explorer(分析型,擅长读代码查资料)和monitor(监控型,适合长时间轮询任务)。模型在派生子智能体时会根据任务性质自动选择合适的角色。
这其实跟Claude Code的Agent teams非常像。
每个子智能体还能起昵称,方便区分谁在干什么。比如你可以给一个Agent起名叫frontend,另一个叫backend,通过/agents命令随时查看各个智能体的工作状态和进度。
还有一个挺有意思的功能叫spawn_agents_on_csv。你可以准备一个CSV文件,每一行是一个任务描述,Codex会自动把这些任务分发给多个子智能体并行执行,还带进度条和预计完成时间。这个玩法比较适合批量处理场景,比如批量代码审查、批量文件重构、批量给多个模块写单元测试之类的。
再看一下TUI(终端界面)层面的改进。这些功能单独拿出来都不大,但加在一起,日常使用的体感提升很明显。
0.105加了代码块和diff的语法高亮,终于不用对着一坨纯文本看代码了。还新增了/theme命令,可以实时预览和切换主题配色,支持导入.tmTheme格式的主题文件,亮色和暗色终端都做了适配。对于我这样喜欢纠结配色的主题的人来说,可以算得上是贴心的设计了。
/copy命令也是个小而美的更新,一键复制Codex最新的完整回复到剪贴板。之前想把Codex生成的代码拿出来,得手动选中、复制,碰到长回复还得翻好几屏。现在一个/copy搞定。Ctrl+L清屏也终于来了,关键是清完屏上下文还在,不会丢失聊天记录。
今天更新的0.106版本,内容相对偏底层。加了macOS和Linux的一键安装脚本,降低了上手门槛,不用再折腾npm安装了。内存管理方面引入了diff-based forgetting和usage-aware selection,简单来说就是Codex在长会话中会更聪明地遗忘不重要的上下文,优先保留你最近频繁用到的信息。从经验来看,长会话跑到后面经常会出现AI忘记前面说过什么的情况,这个改进应该能有效缓解这个问题。
其实从这波更新能明显看出来,OpenAI在Codex CLI上的投入力度在加大。24个小时三个版本,语音输入、多智能体、TUI大改,这种更新密度在之前是很少见的。
Codex CLI和Claude Code之间的功能差距正在快速缩小,AI厂商越卷,工具就越好用,对广大开发者来说也是更加利好。
Codex这波更新详细地址:
https://github.com/openai/codex/releases
所以,赶紧更新你的Codex,上手最新版本开始Vibe Coding!
感谢您阅读我的文章。我是鲁工,九年AI算法老兵,AI全栈开发者,深耕AI编程赛道。感兴趣的朋友也可以加我微信(louwill_)交个朋友。
53AI,企业落地大模型首选服务商
产品:场景落地咨询+大模型应用平台+行业解决方案
承诺:免费POC验证,效果达标后再合作。零风险落地应用大模型,已交付160+中大型企业
2026-03-06
ollama v0.17.6 发布:重大解析修复与 Qwen3.5 完整支持,全链路优化模型渲染与工具调用
2026-03-05
AReaL v1.0 正式发布:面向 Agent 的全异步强化学习训练框架
2026-03-05
Qwen 和钉钉,无招和俊旸
2026-03-04
开启极简养虾,用 TRAE 快速部署 OpenClaw
2026-03-04
ollama v0.17.5正式发布:新增Qwen3.5系列模型,全方位优化GPU/CPU分配、采样惩罚与内存管理机制详解
2026-03-03
4 天 6.8K Star,这个 AI 漫剧项目火了:waoowaoo!
2026-03-02
FireRed-OCR 开源发布:端到端方案新SOTA!小红书提出低成本文档识别训练范式
2026-03-02
137K 行代码、零 clippy 警告:这个开源项目凭什么让 AI Agent 领域炸锅?
2026-01-27
2026-01-30
2026-01-12
2026-01-29
2025-12-22
2026-01-27
2026-01-28
2026-01-21
2025-12-10
2025-12-23
2026-03-02
2026-02-05
2026-01-28
2026-01-26
2026-01-21
2026-01-21
2026-01-20
2026-01-16