微信扫码
添加专属顾问
我要投稿
微软Edge浏览器推出Copilot模式,号称能读懂网页内容,但实际功能与市面AI浏览器大同小异。 核心内容: 1. Edge浏览器新增Copilot模式的主要功能 2. 微软CEO对AI功能的过度包装与宣传 3. 免费使用ChatGPT付费功能的短期吸引力
具体来说,Edge 浏览器中的 AI 功能不再像以前一样只是一个聊天侧边栏,新推出的 Copilot 模式可以让 AI 阅读和理解网页内容,比如帮你做一个技术文档页面的解读或者 Youtube 视频的观看大纲。
它也可以一次性浏览所有你已打开的网页,当你在多个商品或者酒店页面来回切换烦恼时,帮你列一个对比表格来辅助决策。微软还增加了语音功能,你可以通过语音聊天来理解网页、和 AI 实时对话。
这些功能看上去与市面上已有的 AI 浏览器好像没什么不同,但微软 CEO 萨提亚·纳德拉(Satya Nadella)对此赞不绝口,“这是我们为 AI 时代重新定义浏览器的第一步。”他说他最喜欢 multi-tab RAG 功能,可以让他更快地分析微软过去一年在 Nature 上发表的论文——介绍新功能的同时顺带炫耀一番。
目前该功能尚处实验阶段,微软称将会逐渐为 Copilot 模式加入新功能。实验的另一层含义是现在 Copilot 模式为“限时免费”。考虑到目前 Copilot 仍由 OpenAI 提供基础模型支持,这意味着你可以免费使用不少 ChatGPT 的付费功能。
比如你可以在 Copilot 模式下使用 ChatGPT 中付费的 DeepResearch 功能。纳德拉还透露他们将推出任务代理功能,让用户在浏览网页的同时委托 Copilot 处理任务。一位 AI 创业者将其称之为 ChatGPT Agent 的免费替代版。ChatGPT Agent 目前仅向 Plus 及以上用户开放,最低月付费 20 美元。
这大概也是当前 Edge 相较其他 AI 浏览器最大的吸引力了。在 OpenAI 还没正式推出自家浏览器之前,你可以在 Edge 中使用平替版的 ChatGPT——算是为山姆·阿尔特曼(Sam Altman)脱离微软又提供了一个借口。
Edge 能读懂网页了,但也仅此而已
和 2023 年最初宣布 Edge 浏览器向 AI 转型一样,微软官网发布的产品更新中对 Copilot 模式依然添加了不少宏大的名词概念,诸如“我们正见证着网络互动方式的转折点”“这是我们进一步探索更强大网页浏览方式的下一步”等等。
但用户打开 Copilot 模式之后,最明显的感知或许就是主页界面变成了一个 Copilot 对话框,微软称之为“整合了对话、搜索和网页导航”,敲入关键词时可以启用 Bing 搜索也可以直接与 Copilot 对话。
Copilot 模式宣传片
微软在产品文档中介绍,Copilot 可以理解用户意图,帮助用户更高效地理清信息,不再被庞杂的标签页面困扰。你在浏览网页时,也可以随时调出地址栏左侧的 Copilot 提问,Copilot 还可以根据用户的历史记录,预测用户下一步操作给出建议。
以前段时间 Manus 在官网发布的 AI Agent 上下文工程的技术文档为例。打开网页,Copilot 可以理解网页内容,为用户提供文档解读或大纲。它似乎也可以理解视频内容,比如对一则 Youtube 视频进行要点整理,生成视频摘要。
Copilot 总结网页内容
Copilot 总结 Youtube 视频
针对电商网站,Copilot 还可以根据商品详情页进行 AI 总结,还会提供历史价格走势图、与其他网站进行比价等。不过这项功能仅适应于亚马逊、Shein 等海外购物网站,国内淘宝、京东等电商网站尚不支持。
Copilot 总结商品页面
但这些只能算是 AI 浏览器的基础能力。国内的夸克、豆包乃至 QQ 浏览器也有类似功能,夸克的 AI 总结会将原有网页转换阅读模式,豆包也可以对 B 站上的视频进行分析整理,QQ 浏览器还推出了网页搜索与模型对话的双屏功能。更不客气点,你在 Chrome 上安装一个 AI 插件就可以获得近似体验,还能自定义模型。
Copilot 模式更显著的区别是它具备了主动能力,比如 AI tab grouping,可以自动按主题将你的标签页归组。又或者纳德亚口中的 multi-tab RAG 功能,它可以让 AI 浏览用户已打开的所有标签页内容,无论你是在阅读论文、比较酒店或者浏览新闻,都可以快速启用这一功能,“让你的浏览器变成一个帮助你轻松比较、决策和完成任务的工具。”
《山上》实测了包括淘宝、京东以及亚马逊等多个国内外的电商网站,Copilot 都可以整理多个不同平台、网页的商品型号、卖点、价格、评价等,给出一个详细的购买建议。此前国内密集更新的 AI Agent 产品,多数也都能实现类似功能。
Copilot 总结天猫商品页面并给出购买建议
但也仅此而已了,和市面上所有号称 Agent 能力的产品一样,Copilot 并没有打通支付环节,无论是预定酒店、购买商品还是规划行程,它都无法实现微软宣传片中的无缝体验,这些功能都还是期货。
Copilot 也可以阅读 PDF 文档。打开阿里巴巴的 2024 年的季度财报,Copilot 会阅读文档内容并给出针对性的回答。它还接入了 OpenAI 的文生图能力,连续对话后它会询问你是否需要将财务数据整理成可视化图表。只是仍然没法直接使用,图表中有不少错误,比如完全丢掉了阿里巴巴 2024 年第一季度的业绩——它只阅读了三个网页。
Copilot 阅读 PDF 财报
在语音模式的加入下,微软为 Copilot 模式增加了一个颇具科幻感的 Vision 功能。你可以用语音与 Copilot 实时对话,无论你正在浏览什么网页,都可以直接语音提问“这段在说什么”或者“这张图片是什么”。“它会看到你当前的页面,与你一起阅读,一起讨论你面临的难题。你不会再有独自一人面对所有标签页的孤独体验。”微软此前的产品文档中说。
但这项能力同样不算新鲜。Perplexity 本月初发布的 Comet 浏览器同样支持语音实时交互,但目前 Comet 初期仅向 Perplexity Max 订阅用户($200/月)及部分邀请用户开放,尚未全量铺开。
豆包桌面版同样具备类似功能,但在 Mac 系统下必须打开屏幕共享权限,将整个桌面画面共享给 AI,而 Edge 无需打开屏幕共享。《山上》实测发现,豆包的语音互动无法实时对话打断,只能通过手动点击屏幕打断,互动性不强。与之相比,即便在国内网络环境访问下,Copilot Vision 的反应速度也更快、回答更精准,同时也可以实时打断,交互体验更接近即时沟通。
X 用户 Abram Jackson 分享的录屏
忘掉那些 AI 博主们高呼的网页浏览形式变了的口号吧,就当下的体验而言,Copilot 模式的许多功能与现有 AI 浏览器没有什么不同。微软强调 Copilot 仍处于实验阶段,他们仍将继续增加新功能,用户也可自行选择打开或者关闭。
混战的 AI 浏览器,还没到终极形态
与今年上半年的通用 AI Agent 概念相比,AI 浏览器是一个更早也更快进入到人们视野的产品。最早的 AI 浏览器大多只是在浏览器中内置了部分 AI 能力,提供基础的 AI 对话或网页总结功能。
Agent 热潮袭来之后,更多的 AI 浏览器开始强调自主执行任务的能力,诸如 The Browser Company 的 Dia 浏览器、Perplexity 的 Comet 浏览器以及 Opera Neoa 均属此类。微软在宣传 Edge 中的 Copilot 模式时,同样强调它的主动性。
科技公司们对于 AI 浏览器的热衷不难理解,诞生 30 余年之后,浏览器仍然是人们在桌面端触达互联网的第一窗口——甚至它的核心交互模式都没有发生太大变化,一路从网景、IE 演变到今天的 Chrome,就连 Chrome 也是 17 年前的产品了。
大模型的诞生重塑了人们获取信息的方式,人们普遍相信浏览器也将会发生改变,无论是巨头还是创业公司都试图抢占这一市场。市场调研机构 Market.us 预测,全球 AI 浏览器市场将从 2024 年的 45 亿美元增长至 2034 年的约 768 亿,年复合增长率达 32.8%。
Market.us 报告
但很难说当下的 AI 浏览器与 AI Agent 之间的区隔有多么清晰——二者的底层技术类似、瞄准的方向也是一样的。微软在 Copilot 模式中展现的能力,都可以在 OpenAI 过去半年的功能更新中找到影子。比如 OpenAI 年初更新的 Operator 功能,它让 AI 操作网页成为可能。微软在宣传片中描绘的 Copilot 未来能力,也和 OpenAI 的 ChatGPT Agent 十分类似。
蝴蝶效应在推出 Manus 之前瞄准的就是 AI 浏览器方向,但他们最终放弃了。Manus 联合创始人张涛说,AI 浏览器的用户体验受限,他们意识到要实现真正的通用的人工智能代理,必须要从浏览器界面脱离。
甚至 Perplexity 决定推出 AI 浏览器也像是被迫的,Perplexity CEO Aravind Srinivas 说,他曾经联系 Chrome 团队,希望将 Perplexity 作为 Chrome 的默认搜索引擎,但被拒绝,于是决定自己做一个。
——天知道 Srinivas 怎么想的。纽约时报称,Google 为了成为 Safari 的默认搜索引擎,仅 2021 年就向苹果支付了约 180 亿美元,怎么可能会将自家 Chrome 让给竞争对手。
Srinivas 对于 AI 浏览器的看法也和 AI Agent 有些类似。他今年 4 月的一次播客对谈中说,浏览器就是构建 Agent 的最佳方式。“浏览器本质上就像一个容器化的操作系统。它可以在你已登录第三方服务的情况下,通过隐藏标签页访问这些服务,在客户端抓取页面内容,并代表你进行推理和执行操作。”
换句话说,AI 浏览器其实也是一种 AI Agent。只是由于当前大模型能力受限,仍无法摆脱原有的浏览器框架,只能继续以传统标签页和网页交互为核心,更多只是对现有浏览器体验的增强,而非彻底颠覆。
很难说这样的中间形态会吸引多少用户改变习惯。微软早在 2023 年就开始为 Edge 浏览器加入 AI 功能,但两年下来基本没对 Chrome 造成太大威胁,AI 的带动作用可能还没有 Chromium 内核大。
豌豆荚创始人王俊煜发表在《第一财经》杂志的评论文章称,今天的AI 浏览器虽然努力做了很多体验创新,但还远远不够形成质变。AI 还没有深度融合到浏览器中,没有真正成为“眼睛和手脚”。
Chrome 浏览器的市场垄断地位也很难轻易撼动,多数标榜 AI 的浏览器仍然在使用 Chromium 内核。OpenAI 虽然被传即将推出 AI 浏览器,但他们同时也对收购 Chrome 兴趣颇大。
“即使 Dia 能从其中找到带来 10 倍体验的亮点,我也看不到什么 Chrome 无法跟进的理由。”王俊煜说。5 月,Google 在 Chrome 中增加了 Gemini 入口,可以阅读网页和对话,体验与 Dia 相似。
AI 浏览器往往强调可以自主操作网页,但又带来了隐私安全问题,并不是所有用户都愿意将自己浏览的网页发给 AI。
此前微软在 Windows 中内测 Recall 功能,这是一个内嵌在系统层级的 AI 工具,可以在后台定期截取用户屏幕和内容,以方便用户随时切换至此前时间点。Recall 一经推出就遭遇不少批评,部分媒体报道甚至将其形容为监控软件。
科技媒体 The Verge 报道了微软在 Edge 浏览器中推出 Copilot 模式的消息。文章下的高赞评论写道:“微软在 Edge 的最新更新中捆绑了垃圾软件 Copilot。”
另一条更活泼的评论说,“微软需要决定一下,我到底该在浏览器里使用 Copilot,还是在 Windows 11 里使用?抑或是在 Word 文档的每一行,甚至 Excel 的每一个单元格用?把那个该死的 Copilot 标志塞满每个角落,实在让人心烦。”
53AI,企业落地大模型首选服务商
产品:场景落地咨询+大模型应用平台+行业解决方案
承诺:免费POC验证,效果达标后再合作。零风险落地应用大模型,已交付160+中大型企业
2025-07-30
六大国有银行企业知识库中的大模型技术应用探索
2025-07-30
ChatGPT迎来了重磅更新:Study Mode,有了提示词,国内可以体验了!
2025-07-30
MiniMax Agent 再进化!正式走向商业级全栈开发
2025-07-30
简单粗暴地使用了 Claude Code 大半个月后,我来谈谈它的体验
2025-07-30
大模型之后,机器人正在等待它的“GPT-1 时刻”
2025-07-30
研发了八年基础软件,57 岁的我在 AI 时代迎来了千亿机会
2025-07-30
五年磨一剑:Agent 时代追风不如造风
2025-07-30
国内企业开发的农业AI大模型有哪些?
2025-05-29
2025-05-23
2025-06-01
2025-05-07
2025-05-07
2025-05-07
2025-06-07
2025-06-21
2025-06-12
2025-05-20