免费POC, 零成本试错
AI知识库

53AI知识库

学习大模型的前沿技术与行业应用场景


热闹了!OpenAI 前脚发完 ChatGPT 浏览器,Anthropic 随后推出 Claude 桌面端

发布日期:2025-10-22 14:51:30 浏览次数: 1568
作者:Founder Park

微信搜一搜,关注“Founder Park”

推荐语

AI巨头同日竞技!OpenAI和Anthropic同日发布重磅产品,浏览器集成与全局助手你更pick谁?

核心内容:
1. ChatGPT Atlas三大核心功能解析:内置AI助手/浏览记忆/智能体操作
2. Claude桌面端四大亮点:全局快捷键/屏幕共享/语音输入/工具连接
3. 两大AI产品设计理念对比与行业竞争格局前瞻

杨芳贤
53AI创始人/腾讯云(TVP)最具价值专家

太热闹了!

谷歌的 Gemini 3.0 还没有等到,结果 OpenAI 和 Anthropic 接连在今天发布了新产品。

今天凌晨,OpenAI 发布了一款以 ChatGPT 为核心打造的全新浏览器「ChatGPT Atlas」。ChatGPT Atlas 的三大核心功能都挺实用:

  • 内置 ChatGPT:可通过侧边栏在任意页面调用。在任意网页上点一下右上角的 Ask ChatGPT,旁边就会弹出侧边栏,AI 能直接看到页面内容帮你解答问题,不用再截图或复制粘贴;

  • 浏览器记忆:搜索你的浏览记录。浏览器会记住你的浏览历史,之后可以直接用自然语言提问,比如「帮我找出上周看的所有招聘信息」。这个功能是可选的,隐私设置里能随时关掉或删除记录;

  • AI 智能体:可在页面上执行操作。AI 能像人一样操作浏览器,自动点击、输入、跳转页面。不过目前这个功能只开放给付费用户;

简单说,就是让 ChatGPT 直接「住」进你的浏览器里干活。


刚刚,Anthropic 紧随其后,也正式发布了其 Claude Desktop 桌面端(之前是预览版),主打「随时随地召唤 Claude」。Mac 版的新功能尤其方便:

  • 全局快捷键:双击 Option 键就能在任何界面唤醒 Claude,写代码、看文档时随叫随到;

  • 屏幕共享:可以直接截图或共享整个应用窗口给 Claude,不用反复拖文件;

  • 语音输入:按 Caps Lock 键说话,边想边聊(但注意别和输入法切换冲突);

  • 工具连接:通过 MCP 协议连代码编辑器、本地文件等,让 Claude 直接操作你的工作环境;

两家的思路不一样:OpenAI 想用浏览器把 AI 深度集成到网页操作中,Anthropic 则是让 AI 在电脑全局随时待命。

浏览器市场的大佬谷歌会怎么搞?还是蛮让人期待的。

本篇文章内容转载自「新智元」


超 15000 人的「AI 产品市集」社群!不错过每一款有价值的 AI 应用。

邀请从业者、开发人员和创业者,飞书扫码加群: 
进群后,你有机会得到:
  • 最新、最值得关注的 AI 新品资讯; 

  • 不定期赠送热门新品的邀请码、会员码;

  • 最精准的AI产品曝光渠道



01 

ChatGPT Atlas 上手简单,

但智能体模式要付费

ChatGPT Atlas 的上手非常简单:首次打开时,登录你的ChatGPT账户,并从当前浏览器导入书签、已保存的密码和浏览历史即可。

顺便一提,设成默认浏览器后还可获赠7天「会员」。

今天,全世界的macOS用户都可以下载ChatGPT Atlas使用,包括免费、Plus、Pro及Go用户。Windows、iOS和Android版本很快就会推出。

与此同时,Beta版已经提供给Business用户;开启相关权限后,Enterprise和Edu用户也能使用。

而最为关键的「智能体模式」,则会以预览版的形式向Plus、Pro和Business用户开放。(付费only)

看来,又有一波初创要被杀死了。


02

AI 智能体正式「接管」浏览器

有了Atlas,ChatGPT可以在网络的任何角落与你同行:

在当前所在的窗口中,直接提供帮助,理解你的意图,帮你完成任务,全程无需复制粘贴或离开页面。

由于Atlas内置ChatGPT记忆功能,因此对话可以随时调用过往的聊天记录和细节,助你高效完成新任务。

使用Atlas越多,ChatGPT就会变得越智能、越得力。

浏览器记忆功能让ChatGPT能够记住你访问过网站的上下文,并在你需要时随时调用。

这意味着你可以向ChatGPT提问,例如:「找出我上周浏览过的所有职位招聘,并总结一下行业趋势,帮我为面试做准备。」

同时,浏览器中的记忆也完全由你掌控:在设置中,你可以随时查看或归档记忆,删除浏览历史也会一并删除所有相关的浏览器记忆。

通过智能体模式,ChatGPT还可以在Atlas中为你分担工作。

经过改进,它能更好地结合你的浏览上下文,运行速度更快、用途更广,如今更擅长研究分析、任务自动化,并能在你浏览网页的同时,帮你规划活动或预订约会。

当智能体控制浏览器时,光标的方向和我们常用的正好相反

对此,有网友在试用之后进行了总结:

  • 智能体模式能帮忙搞定很多事,比如在浏览器里用保存的密码订咖啡、填TSA预检申请表。

  • 当智能体所在的标签页处于后台时,会被内容拦截器干扰。

  • 有些网站会阻止Atlas总结内容。

  • 智能体操作起来非常像真人,比如它会通过点击弹窗旁边的空白区域来关闭弹窗。

  • UI很赞,新手引导也超级丝滑。它非常巧妙地利用了Mac的全屏空间,动画效果堪称炸裂。

顺便一提,Atlas依然是基于谷歌的Chromium内核打造。

就是看这满屏的广告,不知道能不能支持屏蔽插件。

工作流无缝衔接

新标签页是你在Atlas中的起点。无论是提问还是输入网址,都能在同一个地方获得更快、更有用的结果。

如果想探索聊天以外的特定结果类型,可以切换至搜索链接、图片、视频和新闻等标签页。

打开一个标签页

接下来,不管你是打开什么网页,点击「询问ChatGPT」即可打开ChatGPT侧边栏,无需离开当前窗口,就能进行内容总结、概念解释或处理各项任务。

ChatGPT能够理解您当前浏览的页面详情,因此它的回复会更贴切、更有帮助。

询问ChatGPT

当你在任意文本框中书写时,ChatGPT也能随时提供帮助,给出实时的编辑和修改建议。

使用光标

为你量身打造

ChatGPT能记住你探索过的内容,并为你建议下一步行动,无论是返回最近访问的页面、深入研究某个主题、发现相关灵感,还是将日常任务自动化。

个性化建议

当你有需要时,只需开口即可。

输入「重新打开我昨天看过的那些鞋子」或「整理一下标签页」,剩下的就放心交给ChatGPT吧。

随心所问

更强能力,更强掌控

在你浏览网页时,你能看到什么、记住什么,完全由你掌控。

你可以清除特定页面的记录,清空全部浏览历史,或者打开无痕窗口临时退出ChatGPT登录状态。

如果你开启了浏览器记忆,ChatGPT将会记住你浏览内容的关键细节,从而优化聊天回复并提供更智能的建议。

比如,根据你近期的活动创建待办事项清单,或基于你浏览过的商品继续研究节日礼物。

浏览器记忆属于你的ChatGPT账户隐私,并由你全权控制。

你可以在设置中查看所有记忆,归档不再需要的内容,或通过清除浏览历史来删除它们。

即使开启了浏览器记忆,你也可以随时通过地址栏的开关决定ChatGPT是否可以查看某个特定网站。

当页面可见性关闭时,ChatGPT将无法查看该页面内容,也不会从中创建任何记忆。

默认情况下,OpenAI不会使用你浏览的内容来训练模型,但你也可以选择开启。

家长控制功能同样适用,并且还添加了如关闭浏览器记忆和智能体模式等新的选项。

让AI帮你做事

在Atlas中,你现在可以直接让ChatGPT采取行动,就在你的浏览器里为你完成各种任务。

此前OpenAI推出的ChatGPT智能体,现已正式原生集成于Atlas中,并且运行速度更快。

想象一下,你正计划一场晚宴,心中已有一份食谱。你可以把食谱交给ChatGPT,让它帮你找到一家生鲜商店,将所有食材加入购物车,并下单送到你家。

在工作中,你可以让 ChatGPT 打开并阅读过去的团队文档,执行新的竞品调研,并将洞察汇总成一份团队简报。

当你提出请求时,ChatGPT可能会询问是否可以打开标签页并执行点击操作来完成任务。你也可以直接选择智能体模式按钮,让ChatGPT开始行动。

在构建Atlas中ChatGPT的智能体能力时,OpenAI增加了多重保障措施以应对新出现的风险,例如:

  • 它无法在浏览器中运行代码、下载文件或安装扩展程序。

  • 它无法访问你计算机上的其他应用程序或文件系统。

  • 在金融机构等特定敏感网站上执行操作时,它会暂停,以确保你在监督其行为。

  • 你可以在登出模式下使用智能体,以限制其对敏感数据的访问,并降低它以你的身份在网站上执行操作的风险。

ChatGPT的智能体能力依然存在风险。除了在代表你行动时可能犯错外,智能体还易受隐藏恶意指令的操纵。

这些指令可能被藏匿在网页或电子邮件等地方,意图覆盖ChatGPT智能体的正常行为,可能导致从你已登录的网站窃取数据,或执行你非预期的操作。

总的来说,此次发布标志着我们正迈向一个全新的未来:

在这里,大部分网络活动都将通过智能体系统完成,你可以把常规工作都交给它处理,从而专注于真正重要的事情。

氛围编程(vibe coding)是AI辅助的起点,而OpenAI想通过ChatGPT Atlas让所有人都能过上氛围生活(vibe lifing),享受AI伙伴随时介入带来的高效生活。

OpenAI表示,Atlas浏览器还在持续进化中,后续产品路线图中将包括:

  • 支持多用户配置文件,满足不同使用场景;

  • 提升开发者工具体验

  • 为使用Apps SDK的开发者提供更多方法,提升他们应用在Atlas中的可发现性


03

Atlas 的背后,

是 Chrome 核心开发者

首先上场的是,Atlas项目工程负责人Ben Goodger,Atlas项目产品负责人Adam Fry,以及Atlas项目首席设计师Ryan O’Rouke。

随后做介绍的是,Atlas项目产品负责人Pranav Vishnu,Atlas团队工程师Justin Rushing,以及Agent功能研发负责人Will Ellsworth。

Ben Goodger是本场直播出席人员中最值得介绍的一位。

拓展阅读:隐藏在浏览器背后25年的男人,被奥特曼找到了!OpenAI剑指Chrome霸权

他是一位浏览器专家,从上世纪开始就开始专注浏览器开发工作。

从网景到火狐,再自2005年起加入谷歌开发Chrome,他是除了当时的领导、也是如今的CEO劈柴哥之外,最接近「Chrome之父」的一位对Chrome开发贡献最大的人员。

2024年,他以谷歌副总裁的身份离开谷歌转投OpenAI,全权负责ChatGPT Atlas的技术开发工作。

而如今ChatGPT Atlas经过一年半的孕育终于付梓,他难掩喜悦,招聘广告也接踵而至。


04

各家都在瓜分 AI 浏览器的市场

在OpenAI DevDay大会上,ChatGPT负责人Nick Turley接受媒体采访时表示,他的灵感来自「浏览器正在重新定义操作系统的样子」。

他指出,浏览器已经彻底改变了人们在线工作的方式,而ChatGPT也正在引发类似的变革。

早在2024年7月,OpenAI就低调发布过一款原型搜索引擎,名为SearchGPT

但到了现在,AI浏览器已经成为AI技术角逐的新前线。

今年夏季,AI新锐公司Perplexity推出自家浏览器产品Comet,一度引发热议。

它主打「简化上网体验」,摒弃传统的谷歌搜索结果「长截图」,转而提供一个「答案引擎」:先给你几条相关链接,再直接用AI回答你的问题。

不仅如此,它还能:

扫描你所有打开的网页标签;总结视频内容;清理邮件收件箱;甚至能在Amazon上代你购物。

9月,谷歌宣布将把自家的Gemini AI助手更深度集成进Chrome浏览器。


未来几个月,Gemini将在Chrome中升级各种功能:

不过,谷歌目前尚未透露确切的上线时间。

随着OpenAI的Atlas正式登场,AI浏览器之战正在升温。

当然,OpenAI能否真正撼动全球超30亿用户的Chrome浏览器,还未可知。

目前来看,AI浏览器在硅谷已成为炙手可热的风口,但它们在大众市场的影响力仍待检验

53AI,企业落地大模型首选服务商

产品:场景落地咨询+大模型应用平台+行业解决方案

承诺:免费POC验证,效果达标后再合作。零风险落地应用大模型,已交付160+中大型企业

联系我们

售前咨询
186 6662 7370
预约演示
185 8882 0121

微信扫码

添加专属顾问

回到顶部

加载中...

扫码咨询