2026年6月4日 周四晚上19:30,报名腾讯会议了解“业务抓夹如何成为前线部署工程师(FDE)”(限30人)
免费POC, 零成本试错
FDE知识库

FDE知识库

学习大模型的前沿技术与行业落地应用


我要投稿

写给 Codex 小白用户的全网最详细教程:从 0 到 1,把它真正用起来

发布日期:2026-06-04 06:48:30 浏览次数: 1533
作者:AI范儿

微信搜一搜,关注“AI范儿”

推荐语

Codex不仅是程序员的神器,更是非技术用户提升效率的智能“手替”,本教程将带你从零开始,轻松掌握它的核心用法。

核心内容:
1. Codex与ChatGPT的本质区别:从“嘴替”到“手替”
2. Codex的进化历程与当前市场地位分析
3. 多种安装与上手使用的详细路径指引

杨芳贤
53AI创始人/腾讯云(TVP)最具价值专家

AI范儿 · 教程实测⏱ 20 分钟

Codex、Claude Code 是当前最牛逼的 Agent 产品,但它们都被这个名字给耽误了。

大家以为它们只是用来写代码的,其实它们是一个真正的智能体,能帮你做完除了写代码以外的很多事情。

所以用过 Codex 和 Claude Code 的人,几乎就不会再去用类似于小龙虾这样的东西了。

今年以来 Codex 的热度非常高,到目前为止已经有 500 多万的周活跃用户,而且其中有 20% 以上是非程序员,增长速度甚至是程序员的 3 倍。

我的群里有很多人经常在问 Codex 到底怎么用、怎么安装。

目前好像确实没有一篇非常详细的、给小白用户的教程,所以我决定来写这么一篇。

01它到底是什么?

所以说它到底是什么?

大家都知道 ChatGPT 这样的工具主要用来做问答,那如果你把它理解为你的“嘴替”,那么 Codex 就是你的“手替”。它可以真正帮你好完成一些任务,比如说:

ChatGPT嘴替 · 只会跟你聊你问它一个问题它给你一段话然后……还是你自己干Codex手替 · 替你动手干你给它派个活它自己动手做做完告诉你“搞定了,你看看”

▲ 图:嘴替 vs 手替

1帮你写个游戏、写个 APP

2做个海报、写个 PPT、画个图

3甚至还包括整理文件、整理数据等等

希望你能理解,它是一个智能体,比“小龙虾 OpenClaw”、“Hermes” 还强大很多的智能体,它还能完整地操控你的电脑

它不只是用来写代码的,而且也能够在手机端进行使用。当然,目前仍然是用来写代码的人多。

02Codex 的前世今生

很多人以为 Codex 在 Claude Code 出来之后,OpenAI 为了竞争推出的产品。

虽然它是今年才进入大部分人视野的,但其实这玩意在 2021 年就有了,当时它只是一个用来写代码的工具。

后来到了 GPT-4 出来之后,因为 GPT-4 本身写代码的能力就很强,所以当时OpenAI 就停掉了这个项目。

但让人没想到的是,这两年 Claude Code 一骑绝尘,几乎变成了所有程序员首选的编程工具。

这下可把 OpenAI 给急坏了,所以又把 Codex 重新捡了起来。

因为 Claude Code 已经非常强大了,所以 OpenAI 做的事情很简单,就是全面复制 Claude Code。

其实这么做的还有一家公司,就是谷歌,他们推出了类似产品 antigravity,但真的很糟糕。

OpenAI 的追赶速度非常快,而且口碑也非常好,所以有大量的曾经用 Claude Code 的用户,在很短的时间内都转过来了。

而且相对来说,Claude 的这家公司还是比较傲娇的,动不动就把用户的账号给封了,它不仅贵,而且额度限制真的很让人抓狂。在这方面,Codex 就会好很多。

03怎么安装

我们可以通过多种方式来使用 Codex,包括:

1使用 APP

2在你的 IDE 里面用

3使用命令行

4在浏览器里面使用

但我最推荐的还是使用它的 APP 了。

在下载之前还是得先说一下,使用它的前提是需要“魔法”和一个 ChatGPT 的账号,然后才可以继续。

现在不管是 Windows 还是 macOS,也不管是英特尔的 CPU 还是苹果的芯片,都有对应的版本。

所以首先,我们到这个地址去下载对应的版本:https://openai.com/zh-Hans-CN/codex/get-started/

我用的是 Mac,所以我整个演示也都是基于苹果芯片的 macOS。

▲ 图:下载 macOS 版本

所有的 ChatGPT 套餐都包含了 Codex。也就是说,Codex 的额度是在你的 ChatGPT 账号里面的。

下载完成之后,我们可以用 ChatGPT 账号来直接登录,当然你也可以用 OpenAI 的 API 密钥的方式来登录。

▲ 图:用 ChatGPT 账号登录

需要注意的是,如果您用 API 密钥的方式登录,有些功能是不能使用的,具体可以看官方文档。

▲ 图:OpenAI API 秘钥方式登录

成功登录之后,我们就可以来使用 Codex 了。

04初识 Codex

如果你从来没有用过 Codex,打开之后你发现挺懵逼的,因为它的界面不像 ChatGPT 一样只有一个输入框,它还多了蛮多东西。

所以在正式使用前,我觉得还是有必要先来熟悉一下它的整个界面。

右边的对话区域,其实跟熟悉的ChatGPT 的界面基本类似。

重点在于左边,左边又分为上下两个部分:

1上面这部分可以理解为功能所在的区域(功能区)

2下面就是我们所有的对话或者是项目记录,都会在这里展示(对话历史区)

然后在右侧的顶部,我们还会发现有两个按钮。

我们先来看右边最主要的对话区,也就是聊天框所在的这个区域。

这里跟 ChatGPT 这样的聊天框很像,但是仔细看,它下面还多了一些选项。

首先我们可以在这里选择模型的版本,比如是 GPT 5.5 还是 5.4,这个大家就很熟悉了,但这里还多了两项:一个是推理,另外一个是速度。

所谓的“推理”,其实就是要告诉这个模型,在执行任务的时候应该思考多少。这里分了四个档:低、中、高,还有超高档。

简单来说,推理程度越低就越快,消耗的 token 也会越少。但对于一些比较难、复杂问题,你可能需要很高的推理,这样的话它用的时间会比较长,消耗的 token 也会比较多。

默认我们选择“中”就可以了。如果你还不清楚到底该怎么选,其实官方有一张表格,你可以去参考一下。

档位
适合什么场景

low
稍微想一下,速度和成本优先。比如数据分析、起草文字、执行类的编码、客服对话

medium · 默认
质量和可靠性都要,任务需要规划和判断。大多数活默认选它,最均衡。比如写代码、做调研、处理表格和幻灯片

high
难题、复杂调试、深度规划,质量比速度更重要。比如复杂的智能体任务、长线调研
超高
xhigh
要跑很久的深度任务,只在确实值得花这个时间和钱时才用。比如安全审查、代码审查、更深的研究

▲ 表:推理档位怎么选(据 OpenAI 官方文档整理)

这里还有一个“速度”选项,它可以在不降智的情况下提高模型运行速度。

这很容易理解:通常情况下,速度越快代表思考越少,质量就会随之下降。但如果你想又快又好,就可以选择这个快速模式,代价是消耗的 token 会更多。

快速模式支持将模型速度提高 1.5 倍,目前支持这个模式的是 GPT-5.5 和 GPT-5.4。

它们的消耗情况如下:

好,左边我们还看到会有一个选择权限的功能。这还蛮显眼的,因为这个 App 可以在你电脑上操作你的文件,那操作文件就意味着会有权限的问题。

那这个时候怎么处理这个权限呢?你可以选择以下几种模式:

▲ 图:三种权限模式

我建议你可以选择“替我审批”,这样的话两者就都兼顾了。

这里下面还有一个很关键的“进入项目工作”,这是啥意思呢?

就是在 Codex 里面,我们可以跟 ChatGPT 一样直接对话,也可以基于某一个特定的项目。

比如你已经有了一个代码库,那你现在所有的操作都是基于这个代码库去改代码,或者做其他事情。

当然也可以是其他项目,比如你做数据分析,你希望所有跟这个数据分析相关的事情都在这个项目里面操作。

你可以理解为,这个“项目”其实就是一个文件夹。在这个文件夹里面,你可以发起很多很多不同的对话。这其实就是帮我们组织对话的一种方式。

这个项目你可以添加,也可以利用现有的一个项目文件夹。比如说一个已经有的代码库。

理解了这一点之后,我们来看左侧有两个分类:一个是“项目”,一个是“对话”。

1项目:你所有的项目都会以文件夹的形式出现在这个分类里。

2对话:不在项目里的单独对话,就会出现在“对话”分类中。

这其实和 ChatGPT 的对话记录非常类似,每一个对话都会有一个单独的 Session 出来。

讲完这个,我们再来看左侧上面那个部分。这里面有新对话、搜索、插件、自动化、Codex 移动版这几个功能,我们可以把这里定义成“功能区”。

新对话很简单,就是发起一个新的对话。搜索可以在你所有的对话历史记录中进行搜索。

插件这里非常重要。

OpenAI Codex 中有很多预置的插件,通过这些插件你可以做很多事情:操作你的电脑、用浏览器插件操控浏览器、进行产品设计和数据分析等。

这些功能都是以插件的方式呈现的,插件的存在大大扩展了 Codex 的能力。

用过小龙虾的人都应该知道 Skills,没有 Skills 小龙虾就啥也干不了。  Codex 里面也可以使用 Skills,它也在那个插件的分类里面。

而且因为 Skills 是通用的标准,所以你在小龙虾里面或者在 Claude Code 里面用 Skills,都可以直接在这里面安装使用。

因为这个部分实在太重要了,所以后面我会单独一节来写。

这里还有一个自动化工具叫小龙插件,它可以自动化地帮你处理一些事务,比如每日简报、每周回顾、项目监控。

最后一个是Codex 移动版,它可以把手机连接到这台 Mac 上。这样当你在外地的时候,就可以通过手机来远程控制你的电脑,让电脑帮你干活。

我想像这种操作你应该已经很熟悉了。

左下角这边还有一个设置,你点击之后可以看到你的剩余用量。

这里还会显示 5 小时剩余多少、一周剩余多少。

当然,这里面还有最重要的是,你可以在设置里面对 Codex 做很全面的设置。

05小试牛刀:做一个网站

到这里,你可能已经蠢蠢欲动,想马上用起来了。所以接下来我们就以一个具体案例,来展示一下 Codex 到底怎么用。

这个案例我们来设计一个虚拟的咖啡馆网站:

1创建项目

首先我们要创建一个项目,因为这样我们后面生成的所有文件都会在这个项目里。

2开启计划模式

这里记得,创建完项目之后不要马上让它开始干活,我们要先打开“计划模式”。

为什么要打开这个模式呢?是因为我们要让它先把所有的计划列出来,等我们确认没问题之后再去执行。

我们人类也是这么干活的。

3提交提示词与确认

做好这两步之后,就可以把提示词丢给它了。

在接下来的过程中,它会不断跟你确认一些东西,以弹窗的方式呈现,你只要做选择就可以了。

4需求文档与执行

确认到最后,它会把你理解的所有需求整理成一份文档给你,这就是计划模式最后呈现的结果。

如果你觉得没问题,可以直接选择按这个方案执行;如果有问题,也可以让它修改。

在这个案例里,我就直接让它执行了,接下来它就吭哧吭哧地帮我把这个咖啡馆的网站给做出来了。

整个网站最后都会以 HTML 的方式呈现,我们可以直接点击打开。因为 Codex 里面已经内置了一个浏览器,我们在右边就可以看到这个预览。

可以看到整个网站设计还是非常美观且实用的,就像一个真实的网站一样。我觉得它比大部分公司做的网站可能还要漂亮。

▲ 图:做出来的咖啡馆网站

但是有个问题:如果要修改怎么办呢?

你可能会想到直接在对话框里面写一堆的文字要求让它改,但这是一种比较麻烦的方式。

因为有些东西你可能很难描述清楚,比如在哪个具体位置修改什么内容,很简单的事情要写成文字,反而会非常麻烦。

那么有没有一种方式,能让我们实现“指哪改哪”?

还真有。

可以看到在右上角有一个加号,点击这个加号就可以进入评论模式。

在这个模式下,当我们在页面上移动鼠标时,会发现这些元素一个个都拆开来了。

假设你要修改某个地方,直接点击那里,就会弹出一个对话框。在这个框里,你就可以输入评论,写下你希望它如何修改的具体要求。

实际上这里有两种方式:

1输入评论,让它直接改

2通过设置选项修改

如果只是简单地改个字体、颜色,甚至改一段文本,你可以点击左侧的设置选项。这里会弹出一个菜单,让你直接修改字体和颜色。

这真的太方便了!比如我在这里改个字体,改完之后直接能看到效果,点确认。注意,最后记得右上角的发送进行最终的修改。

如果你发现改了之后好像没生效,那应该是缓存的问题。别忘了点一下左上角那个刷新的按钮就可以了。

我相信用过的人一定会特别喜欢这个功能。

其实左上角还有一个截屏的按钮,一点这个就直接把当前你看到的这部分截图,这样的话你就可以很方便地把你的设计分享给别人了。

可以说 Codex 的设计还是非常非常方便我们真正来进行一些实际工作的。

06技能与插件:让它真正变强

如果只是写一个简单的页面,那其实没什么亮点,现在很多工具都能做。

但Codex 能做的远不止这些,它能操控电脑、操控浏览器、处理大量文件和数据、做财务分析以及生成PPT啥的。

这些功能,就的通过插件和技能来实现了。

也正是因为这些,才让 Codex 真正变得强大、能帮你干活,变成一个智能体,而不只是聊天机器人。

玩过小龙虾的人,对技能(Skills)应该再熟悉不过了,我们可以把很多重复要做的事情写成技能,下次直接调用就好了。

所以技能会包括指令、用到的资源以及还可能包含一些脚本。

Codex 的插件标签进去之后会看到“插件”和“技能”两个分类,进入到“技能”里面会看到这里有很多预置的技能可以使用。

可以在这里启用或者禁用某个技能,也可以在这创建一个技能。

点“创建”-》“技能”,就可以创建一个技能了。

会看到它实际上会调用“Skill Creator”这个技能来创建技能,然后输入我们需要相应的提示词就好了。

比如我想创建一个生成公众号封面图的skill,我写了这样的提示词:

创建一个技能,用来给一篇文章生成封面图,要求21:9比例,不要有文字。

完了,它就会自动创建这个skills。

用的时候只需要在聊天框里面输入/会能弹出所有的skills,我们选择刚才创建的那个article cover Image。

▲ 图:输入 / 调用技能

实际上,我们很多时候也不需要这么麻烦,直接在聊天框里面说创建某个skill,它就会自动调用skill creator来创建。

用的时候很多时候,它也会根据上下文自动调用某个对应的skill。

插件比技能更复杂也更强大,它把技能、MCP服务、应用程序全部打包到一起了。

比如说做数据分析,可能要从Gmail、Google Drive里面读数据,还要用到一些根据来做数据处理、生成报表,最后又可能要写入某个地方,比如Notion。

插件会把这些根据都链接上,同时还提供了一堆相关的skills。我们看 CodeX 的数据分析插件,里面就可以发现它有 17 个应用和 15 个技能。

▲ 图:数据分析插件,17 个应用 + 15 个技能

实际上今天 Codex 一口气发布了 6 个这样超强的插件包。除了数据分析,还包括:产品设计、创意制作、销售、财务分析、投资。

在这些插件里面,比较重要的有这么几个:

Computer Use

它是用来操控你的电脑,以及电脑里的任何程序的。

Chrome 插件

它是用来操控 Chrome 浏览器的。

办公处理插件

包括处理电子表格以及 PPT 的插件。

比如说,我想用 Presentation 这个插件来生成一个介绍 Codex 的 PPT,那我就可以直接调用这个插件,然后提交相关的提示词就可以了。

当然我们也可以把某个文档(比如说一个 Word 文档)用这个插件来转成 PPT

07三个让它「长出手脚」的功能

前面这些,说到底还都是它自己在屏幕里捣鼓。但真正让我觉得这玩意儿不一样的,是它能伸手到屏幕外面来。

有三个功能你一定要知道,我把它们理解成给 Codex 装上了眼睛、手,和一根能随时戳你的触角。

给 Codex 装上「眼睛、手、和触角」Computer Use替你操作电脑上的软件Appshots一键把当前窗口甩给它看Chrome 插件替你操作浏览器

▲ 图:三个伸到屏幕外的功能

Computer Use:它能直接动你的鼠标键盘

这是最科幻的一个。

装上这个插件,Codex 就能看见你 Mac 上的画面,然后像个真人一样去点鼠标、敲键盘、操作软件。

什么时候用得上它?那些没法靠命令行、也没现成插件搞定的活,就轮到它出马了。

比如你让它测一个正在做的 App、帮你点开某个软件改设置、或者复现一个只在界面上才会出现的 bug。它会自己打开那个软件,一步步点给你看。

当然,能动你的电脑这事儿,听着就让人有点紧张。

所以它做得很克制:每次要动某个软件之前,都会先问你一句"我能用这个吗"。你点同意它才动,也可以选"以后都允许"。任何时候你想喊停、想自己接管,随时都行。

比如我通过 Computer Use 让它给微信里面的某个人发条消息,它很快就会弹出这样一个确认框。

有几个它碰不了的红线,反而让我更放心:它不能替你输系统密码、不能批准那些安全和隐私的弹窗、也不能去自动化终端。

说白了,真正危险的那几步,它没权限替你做主。

提醒一句:目前这个功能只在 macOS 上有,而且欧洲、英国、瑞士暂时还用不了。

Appshots:一键把眼前的窗口甩给它

这个功能特别顺手。

你正在某个软件里忙活,突然想让 Codex 搭把手,又懒得跟它解释半天你在干嘛——按个快捷键(左右两个⌘键),它就把你当前最前面那个窗口"咔"地截下来,连同里面能读到的文字一起,发给 Codex。

比如我在浏览某个英文网页,我想直接让 Codex 帮我翻译总结,我就可以直接按下 Command,然后让 Codex 帮我总结。

你不用打一个字描述上下文,它直接就看到了你眼前的东西。然后你说"帮我看看这个",它就接着干。

当然我这里只是演示,一般你要翻译的话,肯定不会这么操作。  

这个功能更多是用于原来需要截图处理的场景,比如:你看到一张图,不知道是什么意思;或者说看到一个报错,直接把这个报错发给 AI 来处理。

以此类推,主要是针对这类场景。

Chrome 插件:让它替你逛网页

这个就好理解了,装上它,Codex 就能操控你的 Chrome 浏览器——帮你翻网页、点按钮、填表单,干那些你平时在浏览器里点来点去的活。

不过这里有句话我必须替你叮嘱:它操作的是你已经登录的浏览器,也就是说它点的每一下,网站都当成是你本人在点。

所以让它逛网页的时候,你最好像自己亲手在操作一样盯着点,别让它在你登录的账号里乱来。

如果你想一边自己用浏览器、一边让它干活,可以让它去开另一个浏览器,两边不打架。

08人在外面,也能遥控它干活

前面说的都是你坐在电脑前用。但有个场景特别戳我:人不在电脑前,怎么办?

比如你出门吃个饭、散个步,脑子里突然冒出个想法,想立刻让 Codex 开干。又或者你给它派了个要跑半天的活,出门在外想瞄一眼进度。

这时候,手机就派上用场了。

手机当遥控器,活还在家里那台电脑上跑你的手机在外面下指令隔空喊话家里的电脑真正干活的地方文件、软件都在这

▲ 图:手机是遥控器,不是搬家

这里有个关键,你一定要搞清楚:手机只是个"遥控器",真正干活的还是你家里那台电脑。

什么意思呢?你的文件、你装的插件、你的项目,全都待在那台电脑上,没搬家。手机只是隔空喊一嗓子,告诉它"开干""继续""这步同意"。活儿在电脑那头跑,你在手机这头看结果、下指令、点同意。

所以你在手机上能干的事不少:发起新任务、追加指令、回答它的提问、审批它要做的操作、甚至中途换个模型。就像你人虽然不在工位,但能随时给同事发消息安排活。

养过虾的朋友应该已经闻到了熟悉的味道,不过这里不能跟小龙虾一样接入微信、飞书什么的。

怎么连?记住几个要点:

第一,配对要从电脑上的 Codex App 发起,CLI 和 IDE 插件里弄不了。如下面这个图所示,选择Codex功能区里面的“Codex 移动版”,然后“开始设置”:

接下来会问你是否允许你的设备控制这台电脑,我们选允许就可以了

然后到手机端的机器里面点 Codex,然后按照步骤操作一下就可以了。

注意确保手机这头用的是最新版的 ChatGPT App(iOS 或安卓都行),如果你在 App 里没看到 Codex,先把 ChatGPT 更新一下。


现在我们就能在手机的 ChatGPT 里面看到电脑的 Codex 里面的内容了。

当然,如果需要这样远程操作。你家里那台当"主机"的电脑,得一直开着、联网、登着。

它要是关机了,你在外面自然就遥控不了它了。所以如果你想认真玩这个,最好专门留一台一直开着的电脑当主机,比如一台 Mac mini 扔在家里 24 小时待命。我到这里已经写了很长的一篇文章了,你觉得我还有哪些功能,或是哪些内容需要补充进来?

09一些重要的设置

默认情况下,我们不需要做太多的设置,也可以很好地把 Codex 用起来。但如果你想提高一些效率的话,我建议有些设置你还是要去设置一下。

在“常规”里面有一个“跟进行为”,这是干嘛的呢?这就是说,在开发过程当中是否可以随时发消息来调整任务。

这个地方我们建议选择“引导”,不然的话,你只有等上一个任务完成之后才能做调整,那很麻烦。

▲ 图:跟进行为选“引导”

然后在个性化设置里,我们可以设置自定义指令。这个地方主要告诉 Codex,你希望它怎么跟你协作,比如怎么改代码、怎么解释和输出等等。

目前网上最流行的就是使用 Karpathy 的指南。这个指南现在在 GitHub 上面有 16 万颗星,你直接复制过来就可以了。

地址:https://github.com/multica-ai/andrej-karpathy-skills

▲ 图:把自定义指令填进去

最后一个就是类似于 小龙虾 这样的记忆功能。你打开的话,它就会从你的聊天当中生成记忆,并且可以带入到下一个聊天里面去。

写在最后

作为一般用户,到这里你其实已经可以很好地把 Codex 用起来了。装好、选个模型、把活儿派给它,剩下的就是动动嘴皮子。

但说实话,Codex 的功能远不止这些。特别是如果你涉及开发,它还有一大堆高级玩法没展开,我这篇是给普通人看的,就没往深里挖。

等你上手熟了,想再往下钻,可以去翻翻官方文档:https://developers.openai.com/codex。那里面藏着更多狠货。

写到这儿才发现,不知不觉这篇已经拖得老长了。我坐在电脑前,也是花了大半天才把它码完。  

写这么多,就一个念想:希望你看完能真的搞懂 Codex 是个什么玩意儿,更重要的是,能把它真正用起来。


你装成功了吗?或者卡在了哪一步?评论区聊聊。

觉得这篇有用,顺手点个、点个在看,转给那个总说“我不懂技术”的朋友。

53AI,企业落地大模型首选服务商

产品:场景落地咨询+大模型应用平台+行业解决方案

承诺:免费POC验证,效果达标后再合作。零风险落地应用大模型,已交付160+中大型企业

联系我们

售前咨询
186 6662 7370
预约演示
185 8882 0121

微信扫码

添加专属顾问

回到顶部

加载中...

扫码咨询