微信扫码
添加专属顾问
我要投稿
Codex不仅是程序员的神器,更是非技术用户提升效率的智能“手替”,本教程将带你从零开始,轻松掌握它的核心用法。核心内容:1. Codex与ChatGPT的本质区别:从“嘴替”到“手替”2. Codex的进化历程与当前市场地位分析3. 多种安装与上手使用的详细路径指引
AI范儿 · 教程实测⏱ 20 分钟
Codex、Claude Code 是当前最牛逼的 Agent 产品,但它们都被这个名字给耽误了。
大家以为它们只是用来写代码的,其实它们是一个真正的智能体,能帮你做完除了写代码以外的很多事情。
所以用过 Codex 和 Claude Code 的人,几乎就不会再去用类似于小龙虾这样的东西了。
今年以来 Codex 的热度非常高,到目前为止已经有 500 多万的周活跃用户,而且其中有 20% 以上是非程序员,增长速度甚至是程序员的 3 倍。
我的群里有很多人经常在问 Codex 到底怎么用、怎么安装。
目前好像确实没有一篇非常详细的、给小白用户的教程,所以我决定来写这么一篇。
01它到底是什么?
所以说它到底是什么?
大家都知道 ChatGPT 这样的工具主要用来做问答,那如果你把它理解为你的“嘴替”,那么 Codex 就是你的“手替”。它可以真正帮你好完成一些任务,比如说:
▲ 图:嘴替 vs 手替
1帮你写个游戏、写个 APP
2做个海报、写个 PPT、画个图
3甚至还包括整理文件、整理数据等等
希望你能理解,它是一个智能体,比“小龙虾 OpenClaw”、“Hermes” 还强大很多的智能体,它还能完整地操控你的电脑
它不只是用来写代码的,而且也能够在手机端进行使用。当然,目前仍然是用来写代码的人多。
02Codex 的前世今生
很多人以为 Codex 在 Claude Code 出来之后,OpenAI 为了竞争推出的产品。
虽然它是今年才进入大部分人视野的,但其实这玩意在 2021 年就有了,当时它只是一个用来写代码的工具。
后来到了 GPT-4 出来之后,因为 GPT-4 本身写代码的能力就很强,所以当时OpenAI 就停掉了这个项目。
但让人没想到的是,这两年 Claude Code 一骑绝尘,几乎变成了所有程序员首选的编程工具。
这下可把 OpenAI 给急坏了,所以又把 Codex 重新捡了起来。
因为 Claude Code 已经非常强大了,所以 OpenAI 做的事情很简单,就是全面复制 Claude Code。
其实这么做的还有一家公司,就是谷歌,他们推出了类似产品 antigravity,但真的很糟糕。
OpenAI 的追赶速度非常快,而且口碑也非常好,所以有大量的曾经用 Claude Code 的用户,在很短的时间内都转过来了。
而且相对来说,Claude 的这家公司还是比较傲娇的,动不动就把用户的账号给封了,它不仅贵,而且额度限制真的很让人抓狂。在这方面,Codex 就会好很多。
03怎么安装
我们可以通过多种方式来使用 Codex,包括:
1使用 APP
2在你的 IDE 里面用
3使用命令行
4在浏览器里面使用
但我最推荐的还是使用它的 APP 了。
在下载之前还是得先说一下,使用它的前提是需要“魔法”和一个 ChatGPT 的账号,然后才可以继续。
现在不管是 Windows 还是 macOS,也不管是英特尔的 CPU 还是苹果的芯片,都有对应的版本。
所以首先,我们到这个地址去下载对应的版本:https://openai.com/zh-Hans-CN/codex/get-started/
我用的是 Mac,所以我整个演示也都是基于苹果芯片的 macOS。
▲ 图:下载 macOS 版本
所有的 ChatGPT 套餐都包含了 Codex。也就是说,Codex 的额度是在你的 ChatGPT 账号里面的。
下载完成之后,我们可以用 ChatGPT 账号来直接登录,当然你也可以用 OpenAI 的 API 密钥的方式来登录。
▲ 图:用 ChatGPT 账号登录
需要注意的是,如果您用 API 密钥的方式登录,有些功能是不能使用的,具体可以看官方文档。
▲ 图:OpenAI API 秘钥方式登录
成功登录之后,我们就可以来使用 Codex 了。
04初识 Codex
如果你从来没有用过 Codex,打开之后你发现挺懵逼的,因为它的界面不像 ChatGPT 一样只有一个输入框,它还多了蛮多东西。
所以在正式使用前,我觉得还是有必要先来熟悉一下它的整个界面。
右边的对话区域,其实跟熟悉的ChatGPT 的界面基本类似。
重点在于左边,左边又分为上下两个部分:
1上面这部分可以理解为功能所在的区域(功能区)
2下面就是我们所有的对话或者是项目记录,都会在这里展示(对话历史区)
然后在右侧的顶部,我们还会发现有两个按钮。
我们先来看右边最主要的对话区,也就是聊天框所在的这个区域。
这里跟 ChatGPT 这样的聊天框很像,但是仔细看,它下面还多了一些选项。
首先我们可以在这里选择模型的版本,比如是 GPT 5.5 还是 5.4,这个大家就很熟悉了,但这里还多了两项:一个是推理,另外一个是速度。
所谓的“推理”,其实就是要告诉这个模型,在执行任务的时候应该思考多少。这里分了四个档:低、中、高,还有超高档。
简单来说,推理程度越低就越快,消耗的 token 也会越少。但对于一些比较难、复杂问题,你可能需要很高的推理,这样的话它用的时间会比较长,消耗的 token 也会比较多。
默认我们选择“中”就可以了。如果你还不清楚到底该怎么选,其实官方有一张表格,你可以去参考一下。
low | |
medium · 默认 | |
high | |
xhigh |
▲ 表:推理档位怎么选(据 OpenAI 官方文档整理)
这里还有一个“速度”选项,它可以在不降智的情况下提高模型运行速度。
这很容易理解:通常情况下,速度越快代表思考越少,质量就会随之下降。但如果你想又快又好,就可以选择这个快速模式,代价是消耗的 token 会更多。
快速模式支持将模型速度提高 1.5 倍,目前支持这个模式的是 GPT-5.5 和 GPT-5.4。
它们的消耗情况如下:
好,左边我们还看到会有一个选择权限的功能。这还蛮显眼的,因为这个 App 可以在你电脑上操作你的文件,那操作文件就意味着会有权限的问题。
那这个时候怎么处理这个权限呢?你可以选择以下几种模式:
▲ 图:三种权限模式
我建议你可以选择“替我审批”,这样的话两者就都兼顾了。
这里下面还有一个很关键的“进入项目工作”,这是啥意思呢?
就是在 Codex 里面,我们可以跟 ChatGPT 一样直接对话,也可以基于某一个特定的项目。
比如你已经有了一个代码库,那你现在所有的操作都是基于这个代码库去改代码,或者做其他事情。
当然也可以是其他项目,比如你做数据分析,你希望所有跟这个数据分析相关的事情都在这个项目里面操作。
你可以理解为,这个“项目”其实就是一个文件夹。在这个文件夹里面,你可以发起很多很多不同的对话。这其实就是帮我们组织对话的一种方式。
这个项目你可以添加,也可以利用现有的一个项目文件夹。比如说一个已经有的代码库。
理解了这一点之后,我们来看左侧有两个分类:一个是“项目”,一个是“对话”。
1项目:你所有的项目都会以文件夹的形式出现在这个分类里。
2对话:不在项目里的单独对话,就会出现在“对话”分类中。
这其实和 ChatGPT 的对话记录非常类似,每一个对话都会有一个单独的 Session 出来。
讲完这个,我们再来看左侧上面那个部分。这里面有新对话、搜索、插件、自动化、Codex 移动版这几个功能,我们可以把这里定义成“功能区”。
新对话很简单,就是发起一个新的对话。搜索可以在你所有的对话历史记录中进行搜索。
插件这里非常重要。
OpenAI Codex 中有很多预置的插件,通过这些插件你可以做很多事情:操作你的电脑、用浏览器插件操控浏览器、进行产品设计和数据分析等。
这些功能都是以插件的方式呈现的,插件的存在大大扩展了 Codex 的能力。
用过小龙虾的人都应该知道 Skills,没有 Skills 小龙虾就啥也干不了。 Codex 里面也可以使用 Skills,它也在那个插件的分类里面。
而且因为 Skills 是通用的标准,所以你在小龙虾里面或者在 Claude Code 里面用 Skills,都可以直接在这里面安装使用。
因为这个部分实在太重要了,所以后面我会单独一节来写。
这里还有一个自动化工具叫小龙插件,它可以自动化地帮你处理一些事务,比如每日简报、每周回顾、项目监控。
最后一个是Codex 移动版,它可以把手机连接到这台 Mac 上。这样当你在外地的时候,就可以通过手机来远程控制你的电脑,让电脑帮你干活。
我想像这种操作你应该已经很熟悉了。
左下角这边还有一个设置,你点击之后可以看到你的剩余用量。
这里还会显示 5 小时剩余多少、一周剩余多少。
当然,这里面还有最重要的是,你可以在设置里面对 Codex 做很全面的设置。
05小试牛刀:做一个网站
到这里,你可能已经蠢蠢欲动,想马上用起来了。所以接下来我们就以一个具体案例,来展示一下 Codex 到底怎么用。
这个案例我们来设计一个虚拟的咖啡馆网站:
1创建项目
首先我们要创建一个项目,因为这样我们后面生成的所有文件都会在这个项目里。
2开启计划模式
这里记得,创建完项目之后不要马上让它开始干活,我们要先打开“计划模式”。
为什么要打开这个模式呢?是因为我们要让它先把所有的计划列出来,等我们确认没问题之后再去执行。
我们人类也是这么干活的。
3提交提示词与确认
做好这两步之后,就可以把提示词丢给它了。
在接下来的过程中,它会不断跟你确认一些东西,以弹窗的方式呈现,你只要做选择就可以了。
4需求文档与执行
确认到最后,它会把你理解的所有需求整理成一份文档给你,这就是计划模式最后呈现的结果。
如果你觉得没问题,可以直接选择按这个方案执行;如果有问题,也可以让它修改。
在这个案例里,我就直接让它执行了,接下来它就吭哧吭哧地帮我把这个咖啡馆的网站给做出来了。
整个网站最后都会以 HTML 的方式呈现,我们可以直接点击打开。因为 Codex 里面已经内置了一个浏览器,我们在右边就可以看到这个预览。
可以看到整个网站设计还是非常美观且实用的,就像一个真实的网站一样。我觉得它比大部分公司做的网站可能还要漂亮。
▲ 图:做出来的咖啡馆网站
但是有个问题:如果要修改怎么办呢?
你可能会想到直接在对话框里面写一堆的文字要求让它改,但这是一种比较麻烦的方式。
因为有些东西你可能很难描述清楚,比如在哪个具体位置修改什么内容,很简单的事情要写成文字,反而会非常麻烦。
那么有没有一种方式,能让我们实现“指哪改哪”?
还真有。
可以看到在右上角有一个加号,点击这个加号就可以进入评论模式。
在这个模式下,当我们在页面上移动鼠标时,会发现这些元素一个个都拆开来了。
假设你要修改某个地方,直接点击那里,就会弹出一个对话框。在这个框里,你就可以输入评论,写下你希望它如何修改的具体要求。
实际上这里有两种方式:
1输入评论,让它直接改
2通过设置选项修改
如果只是简单地改个字体、颜色,甚至改一段文本,你可以点击左侧的设置选项。这里会弹出一个菜单,让你直接修改字体和颜色。
这真的太方便了!比如我在这里改个字体,改完之后直接能看到效果,点确认。注意,最后记得右上角的发送进行最终的修改。
如果你发现改了之后好像没生效,那应该是缓存的问题。别忘了点一下左上角那个刷新的按钮就可以了。
我相信用过的人一定会特别喜欢这个功能。
其实左上角还有一个截屏的按钮,一点这个就直接把当前你看到的这部分截图,这样的话你就可以很方便地把你的设计分享给别人了。
可以说 Codex 的设计还是非常非常方便我们真正来进行一些实际工作的。
06技能与插件:让它真正变强
如果只是写一个简单的页面,那其实没什么亮点,现在很多工具都能做。
但Codex 能做的远不止这些,它能操控电脑、操控浏览器、处理大量文件和数据、做财务分析以及生成PPT啥的。
这些功能,就的通过插件和技能来实现了。
也正是因为这些,才让 Codex 真正变得强大、能帮你干活,变成一个智能体,而不只是聊天机器人。
玩过小龙虾的人,对技能(Skills)应该再熟悉不过了,我们可以把很多重复要做的事情写成技能,下次直接调用就好了。
所以技能会包括指令、用到的资源以及还可能包含一些脚本。
Codex 的插件标签进去之后会看到“插件”和“技能”两个分类,进入到“技能”里面会看到这里有很多预置的技能可以使用。
可以在这里启用或者禁用某个技能,也可以在这创建一个技能。
点“创建”-》“技能”,就可以创建一个技能了。
会看到它实际上会调用“Skill Creator”这个技能来创建技能,然后输入我们需要相应的提示词就好了。
比如我想创建一个生成公众号封面图的skill,我写了这样的提示词:
创建一个技能,用来给一篇文章生成封面图,要求21:9比例,不要有文字。
完了,它就会自动创建这个skills。
用的时候只需要在聊天框里面输入/会能弹出所有的skills,我们选择刚才创建的那个article cover Image。
▲ 图:输入 / 调用技能
实际上,我们很多时候也不需要这么麻烦,直接在聊天框里面说创建某个skill,它就会自动调用skill creator来创建。
用的时候很多时候,它也会根据上下文自动调用某个对应的skill。
插件比技能更复杂也更强大,它把技能、MCP服务、应用程序全部打包到一起了。
比如说做数据分析,可能要从Gmail、Google Drive里面读数据,还要用到一些根据来做数据处理、生成报表,最后又可能要写入某个地方,比如Notion。
插件会把这些根据都链接上,同时还提供了一堆相关的skills。我们看 CodeX 的数据分析插件,里面就可以发现它有 17 个应用和 15 个技能。
▲ 图:数据分析插件,17 个应用 + 15 个技能
实际上今天 Codex 一口气发布了 6 个这样超强的插件包。除了数据分析,还包括:产品设计、创意制作、销售、财务分析、投资。
在这些插件里面,比较重要的有这么几个:
Computer Use
它是用来操控你的电脑,以及电脑里的任何程序的。
Chrome 插件
它是用来操控 Chrome 浏览器的。
办公处理插件
包括处理电子表格以及 PPT 的插件。
比如说,我想用 Presentation 这个插件来生成一个介绍 Codex 的 PPT,那我就可以直接调用这个插件,然后提交相关的提示词就可以了。
当然我们也可以把某个文档(比如说一个 Word 文档)用这个插件来转成 PPT
07三个让它「长出手脚」的功能
前面这些,说到底还都是它自己在屏幕里捣鼓。但真正让我觉得这玩意儿不一样的,是它能伸手到屏幕外面来。
有三个功能你一定要知道,我把它们理解成给 Codex 装上了眼睛、手,和一根能随时戳你的触角。
▲ 图:三个伸到屏幕外的功能
Computer Use:它能直接动你的鼠标键盘
这是最科幻的一个。
装上这个插件,Codex 就能看见你 Mac 上的画面,然后像个真人一样去点鼠标、敲键盘、操作软件。
什么时候用得上它?那些没法靠命令行、也没现成插件搞定的活,就轮到它出马了。
比如你让它测一个正在做的 App、帮你点开某个软件改设置、或者复现一个只在界面上才会出现的 bug。它会自己打开那个软件,一步步点给你看。
当然,能动你的电脑这事儿,听着就让人有点紧张。
所以它做得很克制:每次要动某个软件之前,都会先问你一句"我能用这个吗"。你点同意它才动,也可以选"以后都允许"。任何时候你想喊停、想自己接管,随时都行。
比如我通过 Computer Use 让它给微信里面的某个人发条消息,它很快就会弹出这样一个确认框。
有几个它碰不了的红线,反而让我更放心:它不能替你输系统密码、不能批准那些安全和隐私的弹窗、也不能去自动化终端。
说白了,真正危险的那几步,它没权限替你做主。
提醒一句:目前这个功能只在 macOS 上有,而且欧洲、英国、瑞士暂时还用不了。
Appshots:一键把眼前的窗口甩给它
这个功能特别顺手。
你正在某个软件里忙活,突然想让 Codex 搭把手,又懒得跟它解释半天你在干嘛——按个快捷键(左右两个⌘键),它就把你当前最前面那个窗口"咔"地截下来,连同里面能读到的文字一起,发给 Codex。
比如我在浏览某个英文网页,我想直接让 Codex 帮我翻译总结,我就可以直接按下 Command,然后让 Codex 帮我总结。
你不用打一个字描述上下文,它直接就看到了你眼前的东西。然后你说"帮我看看这个",它就接着干。
当然我这里只是演示,一般你要翻译的话,肯定不会这么操作。
这个功能更多是用于原来需要截图处理的场景,比如:你看到一张图,不知道是什么意思;或者说看到一个报错,直接把这个报错发给 AI 来处理。
以此类推,主要是针对这类场景。
Chrome 插件:让它替你逛网页
这个就好理解了,装上它,Codex 就能操控你的 Chrome 浏览器——帮你翻网页、点按钮、填表单,干那些你平时在浏览器里点来点去的活。
不过这里有句话我必须替你叮嘱:它操作的是你已经登录的浏览器,也就是说它点的每一下,网站都当成是你本人在点。
所以让它逛网页的时候,你最好像自己亲手在操作一样盯着点,别让它在你登录的账号里乱来。
如果你想一边自己用浏览器、一边让它干活,可以让它去开另一个浏览器,两边不打架。
08人在外面,也能遥控它干活
前面说的都是你坐在电脑前用。但有个场景特别戳我:人不在电脑前,怎么办?
比如你出门吃个饭、散个步,脑子里突然冒出个想法,想立刻让 Codex 开干。又或者你给它派了个要跑半天的活,出门在外想瞄一眼进度。
这时候,手机就派上用场了。
▲ 图:手机是遥控器,不是搬家
这里有个关键,你一定要搞清楚:手机只是个"遥控器",真正干活的还是你家里那台电脑。
什么意思呢?你的文件、你装的插件、你的项目,全都待在那台电脑上,没搬家。手机只是隔空喊一嗓子,告诉它"开干""继续""这步同意"。活儿在电脑那头跑,你在手机这头看结果、下指令、点同意。
所以你在手机上能干的事不少:发起新任务、追加指令、回答它的提问、审批它要做的操作、甚至中途换个模型。就像你人虽然不在工位,但能随时给同事发消息安排活。
养过虾的朋友应该已经闻到了熟悉的味道,不过这里不能跟小龙虾一样接入微信、飞书什么的。
怎么连?记住几个要点:
第一,配对要从电脑上的 Codex App 发起,CLI 和 IDE 插件里弄不了。如下面这个图所示,选择Codex功能区里面的“Codex 移动版”,然后“开始设置”:
接下来会问你是否允许你的设备控制这台电脑,我们选允许就可以了
然后到手机端的机器里面点 Codex,然后按照步骤操作一下就可以了。
注意确保手机这头用的是最新版的 ChatGPT App(iOS 或安卓都行),如果你在 App 里没看到 Codex,先把 ChatGPT 更新一下。
现在我们就能在手机的 ChatGPT 里面看到电脑的 Codex 里面的内容了。
当然,如果需要这样远程操作。你家里那台当"主机"的电脑,得一直开着、联网、登着。
它要是关机了,你在外面自然就遥控不了它了。所以如果你想认真玩这个,最好专门留一台一直开着的电脑当主机,比如一台 Mac mini 扔在家里 24 小时待命。我到这里已经写了很长的一篇文章了,你觉得我还有哪些功能,或是哪些内容需要补充进来?
09一些重要的设置
默认情况下,我们不需要做太多的设置,也可以很好地把 Codex 用起来。但如果你想提高一些效率的话,我建议有些设置你还是要去设置一下。
在“常规”里面有一个“跟进行为”,这是干嘛的呢?这就是说,在开发过程当中是否可以随时发消息来调整任务。
这个地方我们建议选择“引导”,不然的话,你只有等上一个任务完成之后才能做调整,那很麻烦。
▲ 图:跟进行为选“引导”
然后在个性化设置里,我们可以设置自定义指令。这个地方主要告诉 Codex,你希望它怎么跟你协作,比如怎么改代码、怎么解释和输出等等。
目前网上最流行的就是使用 Karpathy 的指南。这个指南现在在 GitHub 上面有 16 万颗星,你直接复制过来就可以了。
地址:https://github.com/multica-ai/andrej-karpathy-skills
▲ 图:把自定义指令填进去
最后一个就是类似于 小龙虾 这样的记忆功能。你打开的话,它就会从你的聊天当中生成记忆,并且可以带入到下一个聊天里面去。
写在最后
作为一般用户,到这里你其实已经可以很好地把 Codex 用起来了。装好、选个模型、把活儿派给它,剩下的就是动动嘴皮子。
但说实话,Codex 的功能远不止这些。特别是如果你涉及开发,它还有一大堆高级玩法没展开,我这篇是给普通人看的,就没往深里挖。
等你上手熟了,想再往下钻,可以去翻翻官方文档:https://developers.openai.com/codex。那里面藏着更多狠货。
写到这儿才发现,不知不觉这篇已经拖得老长了。我坐在电脑前,也是花了大半天才把它码完。
写这么多,就一个念想:希望你看完能真的搞懂 Codex 是个什么玩意儿,更重要的是,能把它真正用起来。
你装成功了吗?或者卡在了哪一步?评论区聊聊。
觉得这篇有用,顺手点个赞、点个在看,转给那个总说“我不懂技术”的朋友。
53AI,企业落地大模型首选服务商
产品:场景落地咨询+大模型应用平台+行业解决方案
承诺:免费POC验证,效果达标后再合作。零风险落地应用大模型,已交付160+中大型企业
2026-06-03
Kimi Work Beta 版邀你体验:你的工作,分我一半
2026-06-03
实测MiniMax M3,全链路Agent要的三块拼图终于凑齐了
2026-06-03
Agent 越能干,你越不敢放手?ANOLISA给它穿上全套防护
2026-06-03
《审慎部署智能体AI服务》指南
2026-06-03
OpenClaw 和 Hermes 没凉,浅层使用先退场了
2026-06-03
Anthropic突然上线全新CLI:一行命令操控Claude全部API
2026-06-03
当 AI 开始拥有“自主调度权”:Claude 4.8 这个新功能,到底有多可怕?
2026-06-03
Codex三大重磅更新上线:合并ChatGPT倒计时
2026-04-15
2026-04-07
2026-03-13
2026-03-31
2026-04-07
2026-03-17
2026-03-17
2026-03-21
2026-04-24
2026-04-17
2026-06-03
2026-06-02
2026-06-01
2026-05-26
2026-05-23
2026-05-21
2026-05-19
2026-05-09