免费POC, 零成本试错
AI知识库

53AI知识库

学习大模型的前沿技术与行业应用场景


我要投稿

OpenAI发布Codex for Chrome,能自动操控浏览器干活了!

发布日期:2026-05-09 01:50:45 浏览次数: 1515
作者:AIGC创意猎人

微信搜一搜,关注“AIGC创意猎人”

推荐语

OpenAI最新发布的Codex for Chrome让AI直接接管你的浏览器操作,彻底解放重复性工作!

核心内容:
1. Codex for Chrome三大核心应用场景:数据报表生成、CRM批量更新、表单自动填写
2. 从编程工具到多模态代理系统的本质跃迁
3. 并行后台运行机制与多任务处理能力

杨芳贤
53AI创始人/腾讯云(TVP)最具价值专家

刚刚,OpenAI发布了Codex for Chrome。

Image

这个扩展让Codex可以直接控制你的Chrome浏览器,你Chrome里已经登录的所有网站,它都可以操作。

Mac跟Windows版本的都有,暂时没有的,可以把Codex更新一下。


它具体能做什么?OpenAI官方提到了几个典型的场景:

A.数据提取和报表生成:

你每天要登录某个内部后台,把昨天的销售数据复制到Excel里做汇总,这套操作需要40分钟。现在你可以告诉Codex:"每天早上9点,帮我把后台昨天的销售数据整理成报表,发到团队邮箱。"它会自动登录、提取数据、生成表格、发送邮件,你第二天早上只需要打开邮箱看结论。

B.CRM批量更新:

销售团队每天都花大量时间在CRM系统里录数据、改状态、查客户。以前这些事情需要人坐在电脑前一个个操作,现在Codex可以直接帮你完成。你给它一份客户名单,让它帮你批量更新,它会自己登录、自己操作、自己验证结果。

C.表单批量填写:

你要注册一批账号,或者要在一堆平台里录入同样的信息,只需要把数据给Codex,告诉它"帮我把这些填进去",它会按照你的要求一个个完成。

这些事情有一个共同的特点:它们以前都需要你亲自动手,现在你只需要说清楚要什么。


Codex,不只是一个编程工具

首先要澄清一件事:Codex这个名字虽然一直都在,但2026年的Codex和几年前的Codex,已经是完全不同的东西了。

Image

Codex最初是OpenAI的AI编程Agent。它的核心能力是帮你写代码、帮你修bug、帮你理解陌生的代码库。它的用户是程序员,这个定位很清楚。

但2026年的Codex,已经变成了一个多模态、多工具的代理系统。它支持的运行环境包括桌面应用、浏览器、IDE,可以处理复杂且需要长时间运行的任务。

你给它一个目标,它自己规划路径、自己执行、自己验证结果。

这不只是一个编程工具的进化,更是从工具到Agent的本质跃迁。


Codex for Chrome是怎么工作的?

Codex的执行方式是并行后台运行。

这意味着它执行任务的时候,不会接管你的Chrome浏览器。你一边正常浏览网页,Codex一边在后台帮你处理任务。它不会打断你的工作,它只是在帮你把你不想做的事情做了。

Image

安装也很简单:从Codex客户端设置进入到电脑操控,找到Chrome插件,按照提示安装即可。从这里跳转到Chrome插件安装:

Image

安装之后,会作为插件出现在插件列表里,选中就可以愉快使用了:

Image

Codex会为不同的任务创建专用的标签组,会自动申请网站权限,你也可以设置允许名单和阻止名单来控制访问范围。

Image

安装好后,让他操作Chrome浏览器,发来一个关于这个新闻的推特,然后就看着它操控浏览器,打开网址,各种点击、确定、发送成功,非常快捷方便。

Image


多Agent并行与Skills:它可以同时做很多件事

Codex客户端还支持同时运行多个代理线程,你可以按项目组织不同的Agent,让它们各自独立工作。

它还支持Git worktrees,意思是多个Agent可以在同一个代码库的不同分支上同时工作,彼此隔离、互不冲突。

Image

举一个具体的例子:

你有两个功能要开发:一个是搜索结果分页,一个是用户评论系统。

这两个功能在代码里可能涉及同一个文件的不同部分。以前你的做法是先做A,做完测试完,再做B,一个周末过去了。

现在你可以让Codex同时开两个Agent,一个做A,一个做B,你去做别的事情,等它们做完,系统会自动处理可能的合并冲突。

你从此从执行变成了做决策,你不需要亲自动手做,你需要判断做得对不对、哪个方案更合理。

与多Agent并行配套的是Skills机制。

你可以把团队的编码规范、部署流程、特定技术栈的注意事项,打包成一个Skill,之后Codex每次工作的时候会按照你设定的规范来,不需要你每次都重复提醒。

官方开源的技能库里已经包括了Figma转代码、Linear项目管理、Vercel/Netlify部署、PDF/Excel处理这些常用能力。


Automations:在你睡觉的时候工作

Automations是Codex另一个被低估的能力。

Image

它可以设定定时任务,每天自动执行某个操作,结果进入审查队列等你看。

每天早上9点自动把前一天的bug按照严重程度分类排序,帮你判断哪些先修、哪些可以往后排。每天自动检查CI的运行结果,把失败的case提取出来分析原因,给出修复建议。

这些事情以前需要一个工程师每天花半小时处理,现在Codex在你睡觉的时候就做完了,你早上起来只需要看结论。

有人用这个方式让Codex每天趁他入睡的时候自动优化工作流,每天醒来都有一点小惊喜。他的AI在帮他发现代码库里可以合并的重复函数、在帮他写日志轮转脚本、在帮他发现可以自动化的流程。


一个本质的变化

OpenAI在X上还说了一句话:Codex正在从纯编码工具向'日常工作代理'演进。

Codex最初的定义是"帮你写代码",它的用户是程序员。

它现在的演进方向是"帮你完成日常工作",用户不再只是程序员,而是所有用户。

Image

你能让它帮你做LinkedIn数据分析、Gmail费用报告整理、表单批量填写、仪表盘监控总结。甚至还接入了GPT image 2,可以直接生成图片,比如上面这张配图就是Codex生成的。这些事情涵盖了你日常工作的很大一部分。

这意味着AI工具正在从生成内容进化到完成执行。

大多数AI工具做的是帮你生成一个草稿、帮你写一段文案、帮你画一张图。生成内容是第一步。Codex在做的是第二步,把你想要的东西落地成真实世界中的操作,不是给你一个结果,是帮你把事情做完。

从建议到行动,是AI工具真正改变工作方式的那一步。

OpenAI还说:Codex是OpenAI向桌面超级App迈进的一部分。

你现在用Codex做的事情,以后可能会变成你日常电脑使用的一部分。

你不需要去想我要打开哪个AI工具,你只需要说我要做一件事,剩下的由Codex来完成。

这个未来,可能比我们想象的来得更快。

Image

比如之前发布的ChatGPT Atlas浏览器,可能就不太香了,它本身就是基于Chromium开发的,可以卸载了。

Image

53AI,企业落地大模型首选服务商

产品:场景落地咨询+大模型应用平台+行业解决方案

承诺:免费POC验证,效果达标后再合作。零风险落地应用大模型,已交付160+中大型企业

联系我们

售前咨询
186 6662 7370
预约演示
185 8882 0121

微信扫码

添加专属顾问

回到顶部

加载中...

扫码咨询