支持私有化部署
AI知识库

53AI知识库

学习大模型的前沿技术与行业应用场景


OpenAI开源的Codex CLI是什么?

发布日期:2025-04-17 12:42:09 浏览次数: 1719 作者:AI2Paradigm
推荐语

探索AI编程工具的新里程碑,Codex CLI如何引领编程领域的未来。

核心内容:
1. Codex CLI的发布背景与意义,及其与ACI概念的联系
2. Codex CLI的核心功能与特性,包括零配置启动、多模态输入等
3. Codex CLI的安全措施与系统要求,确保操作的安全性

杨芳贤
53A创始人/腾讯云(TVP)最具价值专家



-OpenAI开源Codex CLI编程工具

?²·ℙaradg智能平方范式研究:书写解构智能,范式提升认知


Codex CLI 似乎既是工具,也可能是编程领域的代理框架。它允许 AI 自主执行任务,体现了语言模型的代理行为,特别是在编程强化学习场景下。这可能为未来的“代理化软件工程师”铺平道路。



引言

Codex CLI 的背景与意义|2025 年 4 月 16 日,OpenAI 发布了一个开源工具 Codex CLI,旨在通过自然语言与代码的交互,增强开发者的终端工作效率。这款工具运行在本地终端中,允许开发者用自然语言生成代码、编辑文件和运行命令,特别适合那些习惯于命令行环境的开发者。它的发布不仅体现了 AI 在软件开发中的应用,还与近期学术研究中的 Agent-Computer Interface (ACI) 概念密切相关,尤其是 NeurIPS 2024 论文《SWE-agent: Agent-Computer Interfaces Enable Automated Software Engineering》中的理论框架。

正文


-Codex开源发布会中的现场演示

Codex CLI 的核心功能与特性

根据 Codex CLI GitHub 仓库,Codex CLI 具有以下关键功能:

  • 零配置启动:开发者只需提供 OpenAI API 密钥即可使用,无需额外设置。

  • 多模态输入:支持自然语言指令,同时可以接受截图或图表,帮助 AI 更好地理解和实现复杂任务。

  • 聊天式开发:结合 ChatGPT 级别的推理能力,Codex CLI 可以直接操作文件、运行命令,并在版本控制下迭代开发。

  • 多种模式:包括交互式 REPL、非交互式安静模式和 CI 模式,适应不同的开发场景。

  • 安全保障:运行在沙箱环境中,网络禁用,仅限当前工作目录和临时文件,确保操作安全。

具体的安全措施包括:

  • 提供不同的批准模式:Suggest(默认,仅读取文件,需要批准写入/命令)、Auto Edit(读取/写入文件,需要批准命令)、Full Auto(完全自动,但仍网络禁用)。

  • 在 macOS 上使用 Apple Seatbelt 进行额外的沙箱保护,在 Linux 上推荐使用 Docker 并限制网络访问。

  • 未来计划白名单特定命令以启用网络,但需额外保障。

系统要求包括 macOS 12+、Ubuntu 20.04+/Debian 10+、Windows 11 via WSL2,以及 Node.js 22 或更高版本(推荐 LTS),Git 2.23+(可选),最低 4GB RAM(推荐 8GB)。

以下是功能和安全措施的详细对比:

类别详情
功能- 零配置,需 OpenAI API 密钥
- 全自动批准,沙箱安全(网络禁用,目录限制)
- 多模态:支持截图或图表
- 聊天驱动开发,文件操作,版本控制集成
- 支持交互式 REPL、非交互式安静模式、CI 模式
- 合并 Markdown 指令(如 ~/.codex/instructions.md)
- 菜谱包括重构、SQL 迁移、单元测试等
安全措施- 沙箱运行:网络禁用,限制当前目录和临时文件
- 批准模式:Suggest、Auto Edit、Full Auto
- 非 Git 跟踪目录下警告/确认
- macOS 用 Apple Seatbelt 保护,Linux 推荐 Docker 限制网络
- 未来:白名单命令启用网络需额外保障
- 漏洞报告:邮件 security@openai.com

与 SWE-agent 论文和 ACI 的联系

Codex CLI 的设计与 NeurIPS 2024 论文《SWE-agent: Agent-Computer Interfaces Enable Automated Software Engineering》中的理论高度相关。根据 SWE-agent 论文,ACI 是一种为语言模型(LM)代理设计的接口,旨在增强其在软件工程任务中的自主能力,如创建/编辑代码文件、导航仓库和执行测试/程序。论文指出,ACI 与传统的人机交互(HCI)不同,HCI 面向人类直觉,而 ACI 面向 AI 代理的推理,强调:

  • 精简指令集:将复杂的 Linux CLI 抽象为高杠杆动作,减少回合数和成本。

  • 反馈充分且简洁:通过固定格式和必要元数据,避免上下文膨胀。

  • 内置护栏:如语法检查、无效编辑回滚,防止错误连锁反应。

Codex CLI 体现了这些 ACI 特性:

  • ReAct 框架:其操作循环(Thought → Action → Observation)与论文描述的 ReAct 框架一致,允许 AI 代理生成想法和命令,然后根据执行反馈调整。

  • CLI 原生:Codex CLI 直接构建在 Linux shell 之上,必要时调用 CLI 工具(如 sed、grep、pytest)完成代码检查和测试,这与论文中“SWE-agent 基于 Linux shell,允许访问常见 Linux 命令”相符。

  • 性能提升:论文报告 SWE-agent 在 SWE-bench 和 HumanEvalFix 上达到最先进表现(分别 12.5% 和 87.7% pass@1),远超非交互式语言模型,Codex CLI 作为其实践,同样展示了类似的潜力。

Codex CLI 是框架还是工具?

 Codex CLI 是否是“专为编程使用的一款代理框架”,还是“围绕编程强化学习的语言模型的代理行为构建的工具”。从现有信息看:

  • 工具属性:Codex CLI 被描述为一个运行在终端的 CLI 工具,专注于通过自然语言生成代码、编辑文件和运行命令,符合工具的定义。

  • 框架属性:它也体现了代理框架的特性,通过 ACI 概念支持 AI 代理的自主行为,如 ReAct 循环和 CLI 原生操作,特别是在编程场景下强化语言模型的行为。

因此,Codex CLI 似乎既是工具,也可能是编程领域的代理框架,尤其是在结合 SWE-agent 论文的背景下。它为开发者提供了一个平台,让 AI 代理可以自主执行任务,这与编程强化学习的语言模型代理行为密切相关。

对开发者的实际意义与未来展望

对于开发者,Codex CLI 的实际意义包括:

  • 提升生产力:通过自动生成代码、修复 bug、编写测试,减少重复性工作。

  • 加速调试:通过自然语言快速定位和解决问题。

  • 增强理解:帮助开发者更高效地理解代码库。

然而,开发者需注意:

  • 输入质量:AI 的输出依赖于输入的清晰度和上下文的完整性。

  • 审查必要:特别是在关键或敏感代码中,需手动验证 AI 的修改。

未来,随着 ACI 设计的优化,Codex CLI 可能进一步集成到 IDE 中,或发展为更自主的编码助手,可能实现从需求分析到部署的整个流程。OpenAI 的愿景是构建“代理化软件工程师”,Codex CLI 是迈向这一目标的重要一步

结语

具有agentic能力的代理框架天然是工具|Codex CLI 是一个开源工具,运行在终端中,通过自然语言与代码交互,体现了 ACI 概念的实际应用。它既是开发者的实用工具,也可能是编程领域的代理框架,为未来的 AI 驱动开发环境铺平道路。通过 Codex CLI,开发者可以体验到 AI 如何增强工作流程,同时也看到软件开发的未来可能。


53AI,企业落地大模型首选服务商

产品:场景落地咨询+大模型应用平台+行业解决方案

承诺:免费场景POC验证,效果验证后签署服务协议。零风险落地应用大模型,已交付160+中大型企业

联系我们

售前咨询
186 6662 7370
预约演示
185 8882 0121

微信扫码

添加专属顾问

回到顶部

加载中...

扫码咨询