OpenAI大神教你如何榨干Codex

发布日期：2026-05-23 14:46:13 浏览次数： 1997

作者：量子位

微信搜一搜，关注“量子位”

新晋员工确实毫无保留。

Jason Liu，13k星开源库Instructor的作者，刚被OpenAI招进Codex团队没多久，不仅在社交平台大方发API额度；

还写了篇Codex-maxxing，把自己的Codex玩法全抖出来了。

而且是让Codex自动跟进亚马逊退款、定时扫Slack接需求、开着Heartbeats在你洗澡的时候帮你干活的那种。

Codex周活用户4月底已经破了400万，终于来了份“官方使用指南”。

正好，这两天Codex又更新了一波：Appshots截图直喂、Goal模式正式转正、锁屏后也能远程干活。

跟Jason的使用心法叠在一起看会发现，现在大家比拼的，是谁能持续工作更久，谁能真正上岗了……

让它自己跑起来

Jason整套玩法的核心，是把Codex改造成了一个能长期运行、持续接管任务的工作系统。

多数人习惯单次问答结束就关闭会话，但Jason是开着一堆跨月存活的巨型线程，不会随意终止。

他给每个工作流一个置顶线程：管日程的一个、管开源项目的一个、监控社交平台的一个……通过Command-1到Command-9一键跳转。

线程里积累了几个月的对话历史、偏好和决策，再次使用时不用重新交代背景，Agent就能自动承接进度。

当线程生命周期被拉长后，项目背景、沟通习惯和历史决策都会自然沉淀进去，Agent开始具备连续性。

而且Jason下任务不打字，主要靠说。

在他看来，口述能完整保留原始思路，不需要刻意优化Prompt，可以直接把模糊、跳跃、带溯源需求的想法原样丢给Agent。

再配合Codex的Steering功能，还能在Agent执行任务时插队追加指令，说完就走，不用干等。

不过，真正让Codex从工具变员工的，是Heartbeats+@computer这套组合拳。

Heartbeats本质上相当于给Agent加了一层定时任务调度。

Jason有个Chief of Staff线程，每30分钟跑一次——

扫一遍Slack和Gmail，看看有没有需要回复的消息，判断优先级，需要回复的先起草一份草稿，但不发送，最终由人来决定是否发出。

他还举了一个更复杂的例子是，做动画项目时，他会先把视频发到Slack审阅线程，然后让Codex每15分钟检查一次线程。

如果同事提了反馈，Codex就重新渲染一个新版本并回复到线程里。

因为Slack MCP服务器还不支持文件上传，Agent甚至会自己调用@computer去点“Add file”按钮，把渲染好的文件传上去。

还有一次，Jason在洗澡前让Codex盯着亚马逊客服排队状态，结果等他洗完澡出来，退款已经到账了。

类似的流程，现在已经能扩展到Google Docs评论、GitHub PR Review等场景，只要有反馈就自动推进下一步。

Jason最强调的一点，是验证机制，可以判断任务什么时候终止。

他试过让Codex把Python的Rich库完整迁移到Rust，硬性要求是必须通过原Python库的所有单元测试。

测试能不能通过，决定了任务是否完成；失败了，Agent就继续修。

用他的话说：

没有验证机制的野心，顶多算个愿望而已。

而在最新的这次更新中，OpenAI已经把Goal模式从实验版本转正了。

你只要明确一个最终目标和验收标准，Codex会自主持续推进，短则几小时长则数天，中途可以查进度、调方向，也可以直接暂停。

但前提是任务本身必须存在清晰、可验证的反馈闭环。

记忆放在自己手里

Jason这套用法的另一大核心思路，是个人工作记忆不应该托管在平台内部。

他所有的长期线程都从一个Obsidian vault起步，目录划分为TODO、people、projects、agent、notes等板块。

在顶层AGENTS.md里写明规则：人员信息更新、项目推进、待办办结等变动，都要同步更新知识库对应内容。

也就是说，他几乎放弃了Codex的内置记忆系统，把核心记忆数据存放在本地可控文件中，既能随时查阅手动修改，也能通过版本对比查看变动，出现问题还能一键roll back。

原因是AI承载的记忆体量越大，就越不该把数据锁死在单一平台。

而文件是完全属于用户自己的，后续想换工具、迁平台，拎着知识库就能走，毫无顾虑。

他也提到了Codex自带的记忆功能Chronicle，通过截取屏幕内容来构建上下文。

但这是需要手动开启的实验预览功能，在权限、速率和隐私方面存仍在短板，整体方向可行但还不够成熟。

所以，在他看来，文件系统仍然是最可靠的记忆基础设施。

而且Codex工作台本身也在升级。

Codex的侧边栏不再局限聊天交互，可直接渲染Markdown、筛选表格、阅览PDF与PPT。

Agent还能通过内置浏览器用JavaScript控制网页，用户可以边看边标注，不用来回切窗口。

Jason说他经常在侧边面板里同时打开Storybook审阅UI组件、用Remotion Studio做动画、用Slidev做演示文稿。

而他最喜欢的交付形式，就是一个带JS和CSS的单文件index.html，不用部署，不用服务器，打开就能跑。

另外，他还把Connectors和Skills作为可复用工作流模版。

只要成功做完一件有用的事，就把流程打包起来，下次Codex不用重新学，直接调用就行。

最近Codex还补了一手远程能力，电脑锁屏后Codex可以继续工作，手机端也能实时查看、审批甚至接管任务。

现在好了，你下班它加班，你锁屏它干活，超额KPI这不就来了……

不过，当AI可以持续接管工作，人自己倒是越来越轻松了（doge）。

53AI，企业落地大模型首选服务商

产品：场景落地咨询+大模型应用平台+行业解决方案

承诺：免费POC验证，效果达标后再合作。零风险落地应用大模型，已交付160+中大型企业

相关资讯

2026-07-07

Loop Engineering 实战：实现从日志扫描到预发部署的全自主闭环

2026-07-02

AI 到底在淘汰谁？一边裁掉 12 万人，一边疯抢 12 年老兵和 24 岁创始人

2026-07-02

一文吃透腾讯 WorkBuddy 全功能：模式、模型、技能、连接器、专家与自动化实操指南

2026-07-01

如何把超级个体的产能，转化成组织能力？ | AI跃迁者调研

2026-06-30

我们拿到了企微 AI Agent 的内测资格，提前替你试了一周

2026-06-30

a16z：不要再给Agent标“软件”价格了，AI正式进入劳动力市场！

2026-06-29

Codex 接管群消息后，半小时完成一天的汇总工作

2026-06-29

火山引擎张鑫：企业Agent落地，我们之前忽视了经营问题

联系获取

160+中大型企业正在使用53AI

立即咨询预约演示

把握AI发展的机遇，共同探索、共同进步

2025-01-22

如何打造基于GenAI的员工服务机器人

2025-01-22

热点资讯

企微变“灵”了！全新“面聊”等多功能上线

2026-04-24

腾讯打出企业Agent新底牌：WorkBuddy企业版抢占AI办公统一入口

2026-06-08

Forward Deployed Engineer：AI 时代的新宠岗位，到底干什么？

2026-05-15

Anthropic创始人手册：如何打造一家 AI Native 公司！

2026-05-15

OpenAI Workspace Agents上线：Codex 驱动的AI员工

2026-04-23

Anthropic 和 OpenAI，同一天成立合资公司

2026-05-06

Cursor Team Kit 官方发布，团队使用 Cursor 最佳实践完全公开：17 Skills、1 Agent、2 Rules

2026-05-05

8万份图纸、30个专业：AI审图从哪里切入，钱花在哪里值 | AI4ELAB

2026-04-10

当企业AI走入一线：对用友YonClaw的几点冷观察与热期待

2026-05-20

AgentScope Builder 快速体验：用 Harness 框架快速构建企业自进化智能体

2026-05-27

大家都在问

麦肯锡：80%都在用AI，为什么0%跑通？

2026-06-24

AI产品经理不仅仅是做交互，你得知道智能体做出来以后，如何接进业务系统？

2026-06-24

一个AI销冠数字员工上岗后，销售团队会发生什么变化？

2026-06-23

突破制造业效率“隐形天花板”，如何用WorkBuddy砍掉“重复劳动”？

2026-06-17

那些跑通 AI 变革的团队做对了什么？

2026-06-10

重磅｜Meta杀入企业级Agent市场，微信还会远吗？

2026-06-08

从人机协作到AI主导：我们是怎么把代码质量交给“数字SRE”的？

2026-05-29

AI产品如何从 Skill 走到虚拟员工？

2026-05-27

热门标签

内容创作大模型技术个人提效 langchain llamaindex 多模态技术 RAG技术智能客服知识图谱模型微调 RAGFlow coze Dify Fastgpt Bisheng Qanything AI+汽车 AI+金融 AI+工业 AI+培训 AI+SaaS Skill 提示词技巧 AI+电商 AI面试数字员工 ChatBI AI知识库开源大模型智能营销智能硬件 FDE AI+医疗 MaxKB Palantir Glean Openclaw