我要投稿

写给 Codex 小白用户的全网最详细教程：从 0 到 1，把它真正用起来

发布日期：2026-06-04 06:48:30 浏览次数： 1533

作者：AI范儿

微信搜一搜，关注“AI范儿”

AI范儿 · 教程实测⏱ 20 分钟

Codex、Claude Code 是当前最牛逼的 Agent 产品，但它们都被这个名字给耽误了。

大家以为它们只是用来写代码的，其实它们是一个真正的智能体，能帮你做完除了写代码以外的很多事情。

所以用过 Codex 和 Claude Code 的人，几乎就不会再去用类似于小龙虾这样的东西了。

今年以来 Codex 的热度非常高，到目前为止已经有 500 多万的周活跃用户，而且其中有 20% 以上是非程序员，增长速度甚至是程序员的 3 倍。

我的群里有很多人经常在问 Codex 到底怎么用、怎么安装。

目前好像确实没有一篇非常详细的、给小白用户的教程，所以我决定来写这么一篇。

01它到底是什么？

所以说它到底是什么？

大家都知道 ChatGPT 这样的工具主要用来做问答，那如果你把它理解为你的“嘴替”，那么 Codex 就是你的“手替”。它可以真正帮你好完成一些任务，比如说：

▲ 图：嘴替 vs 手替

1帮你写个游戏、写个 APP

2做个海报、写个 PPT、画个图

3甚至还包括整理文件、整理数据等等

希望你能理解，它是一个智能体，比“小龙虾 OpenClaw”、“Hermes” 还强大很多的智能体，它还能完整地操控你的电脑

它不只是用来写代码的，而且也能够在手机端进行使用。当然，目前仍然是用来写代码的人多。

02Codex 的前世今生

很多人以为 Codex 在 Claude Code 出来之后，OpenAI 为了竞争推出的产品。

虽然它是今年才进入大部分人视野的，但其实这玩意在 2021 年就有了，当时它只是一个用来写代码的工具。

后来到了 GPT-4 出来之后，因为 GPT-4 本身写代码的能力就很强，所以当时OpenAI 就停掉了这个项目。

但让人没想到的是，这两年 Claude Code 一骑绝尘，几乎变成了所有程序员首选的编程工具。

这下可把 OpenAI 给急坏了，所以又把 Codex 重新捡了起来。

因为 Claude Code 已经非常强大了，所以 OpenAI 做的事情很简单，就是全面复制 Claude Code。

其实这么做的还有一家公司，就是谷歌，他们推出了类似产品 antigravity，但真的很糟糕。

OpenAI 的追赶速度非常快，而且口碑也非常好，所以有大量的曾经用 Claude Code 的用户，在很短的时间内都转过来了。

而且相对来说，Claude 的这家公司还是比较傲娇的，动不动就把用户的账号给封了，它不仅贵，而且额度限制真的很让人抓狂。在这方面，Codex 就会好很多。

03怎么安装

我们可以通过多种方式来使用 Codex，包括：

1使用 APP

2在你的 IDE 里面用

3使用命令行

4在浏览器里面使用

但我最推荐的还是使用它的 APP 了。

在下载之前还是得先说一下，使用它的前提是需要“魔法”和一个 ChatGPT 的账号，然后才可以继续。

现在不管是 Windows 还是 macOS，也不管是英特尔的 CPU 还是苹果的芯片，都有对应的版本。

所以首先，我们到这个地址去下载对应的版本：https://openai.com/zh-Hans-CN/codex/get-started/

我用的是 Mac，所以我整个演示也都是基于苹果芯片的 macOS。

▲ 图：下载 macOS 版本

所有的 ChatGPT 套餐都包含了 Codex。也就是说，Codex 的额度是在你的 ChatGPT 账号里面的。

下载完成之后，我们可以用 ChatGPT 账号来直接登录，当然你也可以用 OpenAI 的 API 密钥的方式来登录。

▲ 图：用 ChatGPT 账号登录

需要注意的是，如果您用 API 密钥的方式登录，有些功能是不能使用的，具体可以看官方文档。

▲ 图：OpenAI API 秘钥方式登录

成功登录之后，我们就可以来使用 Codex 了。

04初识 Codex

如果你从来没有用过 Codex，打开之后你发现挺懵逼的，因为它的界面不像 ChatGPT 一样只有一个输入框，它还多了蛮多东西。

所以在正式使用前，我觉得还是有必要先来熟悉一下它的整个界面。

右边的对话区域，其实跟熟悉的ChatGPT 的界面基本类似。

重点在于左边，左边又分为上下两个部分：

1上面这部分可以理解为功能所在的区域（功能区）

2下面就是我们所有的对话或者是项目记录，都会在这里展示（对话历史区）

然后在右侧的顶部，我们还会发现有两个按钮。

我们先来看右边最主要的对话区，也就是聊天框所在的这个区域。

这里跟 ChatGPT 这样的聊天框很像，但是仔细看，它下面还多了一些选项。

首先我们可以在这里选择模型的版本，比如是 GPT 5.5 还是 5.4，这个大家就很熟悉了，但这里还多了两项：一个是推理，另外一个是速度。

所谓的“推理”，其实就是要告诉这个模型，在执行任务的时候应该思考多少。这里分了四个档：低、中、高，还有超高档。

简单来说，推理程度越低就越快，消耗的 token 也会越少。但对于一些比较难、复杂问题，你可能需要很高的推理，这样的话它用的时间会比较长，消耗的 token 也会比较多。

默认我们选择“中”就可以了。如果你还不清楚到底该怎么选，其实官方有一张表格，你可以去参考一下。

档位	适合什么场景
低 low	稍微想一下，速度和成本优先。比如数据分析、起草文字、执行类的编码、客服对话
中 medium · 默认	质量和可靠性都要，任务需要规划和判断。大多数活默认选它，最均衡。比如写代码、做调研、处理表格和幻灯片
高 high	难题、复杂调试、深度规划，质量比速度更重要。比如复杂的智能体任务、长线调研
超高 xhigh	要跑很久的深度任务，只在确实值得花这个时间和钱时才用。比如安全审查、代码审查、更深的研究

▲ 表：推理档位怎么选（据 OpenAI 官方文档整理）

这里还有一个“速度”选项，它可以在不降智的情况下提高模型运行速度。

这很容易理解：通常情况下，速度越快代表思考越少，质量就会随之下降。但如果你想又快又好，就可以选择这个快速模式，代价是消耗的 token 会更多。

快速模式支持将模型速度提高 1.5 倍，目前支持这个模式的是 GPT-5.5 和 GPT-5.4。

它们的消耗情况如下：

好，左边我们还看到会有一个选择权限的功能。这还蛮显眼的，因为这个 App 可以在你电脑上操作你的文件，那操作文件就意味着会有权限的问题。

那这个时候怎么处理这个权限呢？你可以选择以下几种模式：

▲ 图：三种权限模式

我建议你可以选择“替我审批”，这样的话两者就都兼顾了。

这里下面还有一个很关键的“进入项目工作”，这是啥意思呢？

就是在 Codex 里面，我们可以跟 ChatGPT 一样直接对话，也可以基于某一个特定的项目。

比如你已经有了一个代码库，那你现在所有的操作都是基于这个代码库去改代码，或者做其他事情。

当然也可以是其他项目，比如你做数据分析，你希望所有跟这个数据分析相关的事情都在这个项目里面操作。

你可以理解为，这个“项目”其实就是一个文件夹。在这个文件夹里面，你可以发起很多很多不同的对话。这其实就是帮我们组织对话的一种方式。

这个项目你可以添加，也可以利用现有的一个项目文件夹。比如说一个已经有的代码库。

理解了这一点之后，我们来看左侧有两个分类：一个是“项目”，一个是“对话”。

1项目：你所有的项目都会以文件夹的形式出现在这个分类里。

2对话：不在项目里的单独对话，就会出现在“对话”分类中。

这其实和 ChatGPT 的对话记录非常类似，每一个对话都会有一个单独的 Session 出来。

讲完这个，我们再来看左侧上面那个部分。这里面有新对话、搜索、插件、自动化、Codex 移动版这几个功能，我们可以把这里定义成“功能区”。

新对话很简单，就是发起一个新的对话。搜索可以在你所有的对话历史记录中进行搜索。

插件这里非常重要。

OpenAI Codex 中有很多预置的插件，通过这些插件你可以做很多事情：操作你的电脑、用浏览器插件操控浏览器、进行产品设计和数据分析等。

这些功能都是以插件的方式呈现的，插件的存在大大扩展了 Codex 的能力。

用过小龙虾的人都应该知道 Skills，没有 Skills 小龙虾就啥也干不了。 Codex 里面也可以使用 Skills，它也在那个插件的分类里面。

而且因为 Skills 是通用的标准，所以你在小龙虾里面或者在 Claude Code 里面用 Skills，都可以直接在这里面安装使用。

因为这个部分实在太重要了，所以后面我会单独一节来写。

这里还有一个自动化工具叫小龙插件，它可以自动化地帮你处理一些事务，比如每日简报、每周回顾、项目监控。

最后一个是Codex 移动版，它可以把手机连接到这台 Mac 上。这样当你在外地的时候，就可以通过手机来远程控制你的电脑，让电脑帮你干活。

我想像这种操作你应该已经很熟悉了。

左下角这边还有一个设置，你点击之后可以看到你的剩余用量。

这里还会显示 5 小时剩余多少、一周剩余多少。

当然，这里面还有最重要的是，你可以在设置里面对 Codex 做很全面的设置。

05小试牛刀：做一个网站

到这里，你可能已经蠢蠢欲动，想马上用起来了。所以接下来我们就以一个具体案例，来展示一下 Codex 到底怎么用。

这个案例我们来设计一个虚拟的咖啡馆网站：

1创建项目

首先我们要创建一个项目，因为这样我们后面生成的所有文件都会在这个项目里。

2开启计划模式

这里记得，创建完项目之后不要马上让它开始干活，我们要先打开“计划模式”。

为什么要打开这个模式呢？是因为我们要让它先把所有的计划列出来，等我们确认没问题之后再去执行。

我们人类也是这么干活的。

3提交提示词与确认

做好这两步之后，就可以把提示词丢给它了。

在接下来的过程中，它会不断跟你确认一些东西，以弹窗的方式呈现，你只要做选择就可以了。

4需求文档与执行

确认到最后，它会把你理解的所有需求整理成一份文档给你，这就是计划模式最后呈现的结果。

如果你觉得没问题，可以直接选择按这个方案执行；如果有问题，也可以让它修改。

在这个案例里，我就直接让它执行了，接下来它就吭哧吭哧地帮我把这个咖啡馆的网站给做出来了。

整个网站最后都会以 HTML 的方式呈现，我们可以直接点击打开。因为 Codex 里面已经内置了一个浏览器，我们在右边就可以看到这个预览。

可以看到整个网站设计还是非常美观且实用的，就像一个真实的网站一样。我觉得它比大部分公司做的网站可能还要漂亮。

▲ 图：做出来的咖啡馆网站

但是有个问题：如果要修改怎么办呢？

你可能会想到直接在对话框里面写一堆的文字要求让它改，但这是一种比较麻烦的方式。

因为有些东西你可能很难描述清楚，比如在哪个具体位置修改什么内容，很简单的事情要写成文字，反而会非常麻烦。

那么有没有一种方式，能让我们实现“指哪改哪”？

还真有。

可以看到在右上角有一个加号，点击这个加号就可以进入评论模式。

在这个模式下，当我们在页面上移动鼠标时，会发现这些元素一个个都拆开来了。

假设你要修改某个地方，直接点击那里，就会弹出一个对话框。在这个框里，你就可以输入评论，写下你希望它如何修改的具体要求。

实际上这里有两种方式：

1输入评论，让它直接改

2通过设置选项修改

如果只是简单地改个字体、颜色，甚至改一段文本，你可以点击左侧的设置选项。这里会弹出一个菜单，让你直接修改字体和颜色。

这真的太方便了！比如我在这里改个字体，改完之后直接能看到效果，点确认。注意，最后记得右上角的发送进行最终的修改。

如果你发现改了之后好像没生效，那应该是缓存的问题。别忘了点一下左上角那个刷新的按钮就可以了。

我相信用过的人一定会特别喜欢这个功能。

其实左上角还有一个截屏的按钮，一点这个就直接把当前你看到的这部分截图，这样的话你就可以很方便地把你的设计分享给别人了。

可以说 Codex 的设计还是非常非常方便我们真正来进行一些实际工作的。

06技能与插件：让它真正变强

如果只是写一个简单的页面，那其实没什么亮点，现在很多工具都能做。

但Codex 能做的远不止这些，它能操控电脑、操控浏览器、处理大量文件和数据、做财务分析以及生成PPT啥的。

这些功能，就的通过插件和技能来实现了。

也正是因为这些，才让 Codex 真正变得强大、能帮你干活，变成一个智能体，而不只是聊天机器人。

玩过小龙虾的人，对技能（Skills）应该再熟悉不过了，我们可以把很多重复要做的事情写成技能，下次直接调用就好了。

所以技能会包括指令、用到的资源以及还可能包含一些脚本。

Codex 的插件标签进去之后会看到“插件”和“技能”两个分类，进入到“技能”里面会看到这里有很多预置的技能可以使用。

可以在这里启用或者禁用某个技能，也可以在这创建一个技能。

点“创建”-》“技能”，就可以创建一个技能了。

会看到它实际上会调用“Skill Creator”这个技能来创建技能，然后输入我们需要相应的提示词就好了。

比如我想创建一个生成公众号封面图的skill，我写了这样的提示词：

创建一个技能，用来给一篇文章生成封面图，要求21:9比例，不要有文字。

完了，它就会自动创建这个skills。

用的时候只需要在聊天框里面输入/会能弹出所有的skills，我们选择刚才创建的那个article cover Image。

▲ 图：输入 / 调用技能

实际上，我们很多时候也不需要这么麻烦，直接在聊天框里面说创建某个skill，它就会自动调用skill creator来创建。

用的时候很多时候，它也会根据上下文自动调用某个对应的skill。

插件比技能更复杂也更强大，它把技能、MCP服务、应用程序全部打包到一起了。

比如说做数据分析，可能要从Gmail、Google Drive里面读数据，还要用到一些根据来做数据处理、生成报表，最后又可能要写入某个地方，比如Notion。

插件会把这些根据都链接上，同时还提供了一堆相关的skills。我们看 CodeX 的数据分析插件，里面就可以发现它有 17 个应用和 15 个技能。

▲ 图：数据分析插件，17 个应用 + 15 个技能

实际上今天 Codex 一口气发布了 6 个这样超强的插件包。除了数据分析，还包括：产品设计、创意制作、销售、财务分析、投资。

在这些插件里面，比较重要的有这么几个：

Computer Use

它是用来操控你的电脑，以及电脑里的任何程序的。

Chrome 插件

它是用来操控 Chrome 浏览器的。

办公处理插件

包括处理电子表格以及 PPT 的插件。

比如说，我想用 Presentation 这个插件来生成一个介绍 Codex 的 PPT，那我就可以直接调用这个插件，然后提交相关的提示词就可以了。

当然我们也可以把某个文档（比如说一个 Word 文档）用这个插件来转成 PPT

07三个让它「长出手脚」的功能

前面这些，说到底还都是它自己在屏幕里捣鼓。但真正让我觉得这玩意儿不一样的，是它能伸手到屏幕外面来。

有三个功能你一定要知道，我把它们理解成给 Codex 装上了眼睛、手，和一根能随时戳你的触角。

▲ 图：三个伸到屏幕外的功能

Computer Use：它能直接动你的鼠标键盘

这是最科幻的一个。

装上这个插件，Codex 就能看见你 Mac 上的画面，然后像个真人一样去点鼠标、敲键盘、操作软件。

什么时候用得上它？那些没法靠命令行、也没现成插件搞定的活，就轮到它出马了。

比如你让它测一个正在做的 App、帮你点开某个软件改设置、或者复现一个只在界面上才会出现的 bug。它会自己打开那个软件，一步步点给你看。

当然，能动你的电脑这事儿，听着就让人有点紧张。

所以它做得很克制：每次要动某个软件之前，都会先问你一句"我能用这个吗"。你点同意它才动，也可以选"以后都允许"。任何时候你想喊停、想自己接管，随时都行。

比如我通过 Computer Use 让它给微信里面的某个人发条消息，它很快就会弹出这样一个确认框。

有几个它碰不了的红线，反而让我更放心：它不能替你输系统密码、不能批准那些安全和隐私的弹窗、也不能去自动化终端。

说白了，真正危险的那几步，它没权限替你做主。

提醒一句：目前这个功能只在 macOS 上有，而且欧洲、英国、瑞士暂时还用不了。

Appshots：一键把眼前的窗口甩给它

这个功能特别顺手。

你正在某个软件里忙活，突然想让 Codex 搭把手，又懒得跟它解释半天你在干嘛——按个快捷键（左右两个⌘键），它就把你当前最前面那个窗口"咔"地截下来，连同里面能读到的文字一起，发给 Codex。

比如我在浏览某个英文网页，我想直接让 Codex 帮我翻译总结，我就可以直接按下 Command，然后让 Codex 帮我总结。

你不用打一个字描述上下文，它直接就看到了你眼前的东西。然后你说"帮我看看这个"，它就接着干。

当然我这里只是演示，一般你要翻译的话，肯定不会这么操作。

这个功能更多是用于原来需要截图处理的场景，比如：你看到一张图，不知道是什么意思；或者说看到一个报错，直接把这个报错发给 AI 来处理。

以此类推，主要是针对这类场景。

Chrome 插件：让它替你逛网页

这个就好理解了，装上它，Codex 就能操控你的 Chrome 浏览器——帮你翻网页、点按钮、填表单，干那些你平时在浏览器里点来点去的活。

不过这里有句话我必须替你叮嘱：它操作的是你已经登录的浏览器，也就是说它点的每一下，网站都当成是你本人在点。

所以让它逛网页的时候，你最好像自己亲手在操作一样盯着点，别让它在你登录的账号里乱来。

如果你想一边自己用浏览器、一边让它干活，可以让它去开另一个浏览器，两边不打架。

08人在外面，也能遥控它干活

前面说的都是你坐在电脑前用。但有个场景特别戳我：人不在电脑前，怎么办？

比如你出门吃个饭、散个步，脑子里突然冒出个想法，想立刻让 Codex 开干。又或者你给它派了个要跑半天的活，出门在外想瞄一眼进度。

这时候，手机就派上用场了。

▲ 图：手机是遥控器，不是搬家

这里有个关键，你一定要搞清楚：手机只是个"遥控器"，真正干活的还是你家里那台电脑。

什么意思呢？你的文件、你装的插件、你的项目，全都待在那台电脑上，没搬家。手机只是隔空喊一嗓子，告诉它"开干""继续""这步同意"。活儿在电脑那头跑，你在手机这头看结果、下指令、点同意。

所以你在手机上能干的事不少：发起新任务、追加指令、回答它的提问、审批它要做的操作、甚至中途换个模型。就像你人虽然不在工位，但能随时给同事发消息安排活。

养过虾的朋友应该已经闻到了熟悉的味道，不过这里不能跟小龙虾一样接入微信、飞书什么的。

怎么连？记住几个要点：

第一，配对要从电脑上的 Codex App 发起，CLI 和 IDE 插件里弄不了。如下面这个图所示，选择Codex功能区里面的“Codex 移动版”，然后“开始设置”：

接下来会问你是否允许你的设备控制这台电脑，我们选允许就可以了

然后到手机端的机器里面点 Codex，然后按照步骤操作一下就可以了。

注意确保手机这头用的是最新版的 ChatGPT App（iOS 或安卓都行），如果你在 App 里没看到 Codex，先把 ChatGPT 更新一下。

现在我们就能在手机的 ChatGPT 里面看到电脑的 Codex 里面的内容了。

当然，如果需要这样远程操作。你家里那台当"主机"的电脑，得一直开着、联网、登着。

它要是关机了，你在外面自然就遥控不了它了。所以如果你想认真玩这个，最好专门留一台一直开着的电脑当主机，比如一台 Mac mini 扔在家里 24 小时待命。我到这里已经写了很长的一篇文章了，你觉得我还有哪些功能，或是哪些内容需要补充进来？

09一些重要的设置

默认情况下，我们不需要做太多的设置，也可以很好地把 Codex 用起来。但如果你想提高一些效率的话，我建议有些设置你还是要去设置一下。

在“常规”里面有一个“跟进行为”，这是干嘛的呢？这就是说，在开发过程当中是否可以随时发消息来调整任务。

这个地方我们建议选择“引导”，不然的话，你只有等上一个任务完成之后才能做调整，那很麻烦。

▲ 图：跟进行为选“引导”

然后在个性化设置里，我们可以设置自定义指令。这个地方主要告诉 Codex，你希望它怎么跟你协作，比如怎么改代码、怎么解释和输出等等。

目前网上最流行的就是使用 Karpathy 的指南。这个指南现在在 GitHub 上面有 16 万颗星，你直接复制过来就可以了。

地址：https://github.com/multica-ai/andrej-karpathy-skills

▲ 图：把自定义指令填进去

最后一个就是类似于小龙虾这样的记忆功能。你打开的话，它就会从你的聊天当中生成记忆，并且可以带入到下一个聊天里面去。

写在最后

作为一般用户，到这里你其实已经可以很好地把 Codex 用起来了。装好、选个模型、把活儿派给它，剩下的就是动动嘴皮子。

但说实话，Codex 的功能远不止这些。特别是如果你涉及开发，它还有一大堆高级玩法没展开，我这篇是给普通人看的，就没往深里挖。

等你上手熟了，想再往下钻，可以去翻翻官方文档：https://developers.openai.com/codex。那里面藏着更多狠货。

写到这儿才发现，不知不觉这篇已经拖得老长了。我坐在电脑前，也是花了大半天才把它码完。

写这么多，就一个念想：希望你看完能真的搞懂 Codex 是个什么玩意儿，更重要的是，能把它真正用起来。

你装成功了吗？或者卡在了哪一步？评论区聊聊。

觉得这篇有用，顺手点个赞、点个在看，转给那个总说“我不懂技术”的朋友。

53AI，企业落地大模型首选服务商

产品：场景落地咨询+大模型应用平台+行业解决方案

承诺：免费POC验证，效果达标后再合作。零风险落地应用大模型，已交付160+中大型企业