我要投稿

Google 王炸更新 Gemini 和 Chrome 合体绞杀一切竞争对手...

发布日期：2026-01-29 10:22:56 浏览次数： 2654

作者：小互AI

微信搜一搜，关注“小互AI”

很多人一直吐槽 Google，Gemini 那么强了，人家都推出了AI浏览器，为什么Chrome 却一直还是原地踏步？Google 到底在干嘛？

现在它终于来了

Gemini 和 Chrome 合体了...

Google 刚刚发布了基于最新 Gemini 3 模型的 Chrome 重大更新，这不仅仅是一个插件或侧边栏的升级，而是对浏览器核心逻辑的重构。

Chrome 正在从一个被动的“网页浏览工具”，进化为一个能够主动思考、替你干活的“智能代理（Agentic AI）”。

说实话，以前咱们用 AI 得经历多少步骤？先开网页、登账号、想 Prompt，万一网速不给力还得转半天圈圈。要是想让 AI 总结个网页，还得在那儿苦哈哈地复制粘贴，简直麻烦得要死。

这次升级后，Chrome 基本上变成了 Gemini 的“完全体容器”。

Google 这次是打算把 AI 直接缝进你的浏览肌肉里，甚至要开启“无人驾驶”模式。

这就带大家看看，Google 这次到底在构思什么“大杀器”。👇

先文字长的，看视频介绍：

Side Panel：从“弹窗”变成“常驻协作者”

Google 给 Chrome 加了一个新的侧边栏（Side Panel）。

Side Panel不只是一个简单的聊天框，它变成了一个全能的指挥中心。

以前用 AI，你得切出去，复制粘贴，再切回来。现在？它就住在你手边

无论你打开哪个标签页，Gemini 都随时可用

而且最重要的是：它能看懂你在看什么

多任务处理神器：

你可以一边在主页面写方案、看资料，一边让侧边栏里的 Gemini 去对比多个网站的产品信息、汇总评价、提炼结论。

比如你正在浏览几个不同的数码产品页面，你可以让侧边栏里的 Gemini 直接生成一个“横向对比表”，把这几个网页的参数全部抓取并整理出

你可以在主页面继续当前工作
同时在侧边栏让 Gemini 处理另一项任务
不打断、不切换、不复制粘贴

内置Nano Banana：屏幕上的图片，直接改

这是 Google 在端侧 AI 上的新突破。

你可以在浏览器里直接对网页上的图片进行处理。

以前你想看看一件家具放在房间里是什么效果，得先下载图片、上传到编辑器、祈祷效果还行……现在不用了。

你可以直接指着屏幕上的图片，让 Gemini 修改...

比如你看到一个房间的照片，想看看它更换装修风格的样子，你可以说："帮我把这个房间换成浅色现代风家具。"它就直接生成了。

不需要下载，不需要上传，所见即所改。

Google Workspace 深度打通

Gemini 和 Google 全家桶的联动也更深了。

演示里有个场景：你在看一份课程大纲（比如某个读书会的书单），需要给学习小组发一封邮件，介绍一下要读的书。

以前怎么做？

1.看大纲，记住书名
2.切到 Gmail，新建邮件
3.切回大纲，复制书名
4.切到 Gmail，粘贴
5.想写介绍？再去搜一下这本书讲什么
6.来回切换到头晕……

现在呢？你让 Gemini 读当前页面的大纲，然后说：

"从里面挑三本书，写个简短介绍，用真人秀的风格写，帮我起草一封邮件。"

Gemini 直接从当前页面提取信息，在侧边栏里把邮件写好，连书的简介都给你编好了（而且还是真人秀风格的，带点戏剧性）。

你全程不需要离开正在看的页面。大纲在主窗口，邮件在侧边栏，一心二用，效率翻倍。

写完之后，它还可以调用 Gmail，直接一键发送。搞定。

这种"读当前页面 + 执行另一个任务"的能力，才是 AI 真正融入工作流的样子。

Connected Apps：Google 全家桶深度打通

接下来这个功能，打工人狂喜。

Gemini 不只是跟 Chrome 联动，而是跟整个 Google 生态打通了。官方叫它 Connected Apps（关联应用）。

目前支持的应用包括：

Gmail（邮件）
Google Calendar（日历）
YouTube
Google Maps（地图）
Google Shopping（购物）
Google Flights（航班）

这些应用可以在 Gemini 设置里一键开启。

这意味着啥？举个例子：

你要出差参加一个会议，需要订机票。

以前怎么做？翻邮件找会议时间 → 打开机票网站搜航班 → 比价 → 订票 → 再写邮件告诉同事你的到达时间……

现在呢？你跟 Gemini 说一句："帮我查一下下周那个会议的时间，推荐几个航班，然后写封邮件告诉同事我的到达时间。"

Gemini 自己去翻你的邮件找会议详情，自己去 Google Flights 查航班，自己帮你起草邮件。

一句话，三件事，全搞定。

个人智能 Personal Intelligence：越用越懂你

这个功能目前还在预告阶段，但听起来非常值得期待：Personal Intelligence（个人智能）。

允许 Chrome 记住你的偏好

记住过去的对话上下文

支持自定义指令

提供更“像你助理”的回答

简单说，就是 Gemini 会记住你之前的对话上下文，然后基于这些记忆，给你更个性化的回答。

比如你之前跟它聊过你喜欢什么风格的酒店、你的预算范围、你对航班时间的偏好……下次你再问它"帮我订个酒店"，它就不会从零开始问你一堆问题，而是直接根据你的偏好给推荐。

从一个通用工具，变成一个懂你的私人助理。

当然，Google 强调这个功能是用户主动开启的，你可以选择连接哪些应用，也可以随时断开。隐私控制权在你手里。

真正的核武：Auto Browse（自动浏览）上线！

好，前面都是开胃菜。接下来这个功能，才是这次更新的真正炸裂之处↓

Gemini 开始"接管方向盘"

这是我最想吹爆的功能，没有之一！

以前 AI 只能“动嘴”，现在它能“动手”了。这就是所谓的 AI 正式接管“方向盘”。

这是什么概念？

Gemini 不再只是"回答问题"，而是真的能像人一样打开网页、点击按钮、填写表单、替你完成任务。

场景一：订酒店

演示里，用户说："我想去芝加哥，住某某酒店，帮我查一下这几个周末的价格，还有一些其他要求。"

Gemini 直接打开 Expedia，自己开新标签页，自己点日期选择器，自己筛选条件，最后把搜索结果整理好呈现给你。

不是给你一个链接让你自己去看，是它替你完成了整个搜索流程。

场景二：筛选公寓

在 Redfin（美国找房网站）上，用户说："帮我看看收藏夹里的公寓，把不允许养宠物的删掉，然后把 Gabriel 加为协作者。"

Gemini 打开收藏列表，点进每个房源，看细则，检查宠物政策，不符合的自动移除，最后还帮你邀请了室友。

一个小时的繁琐操作，变成一句话。

场景三：填表格

用户有一份 PDF 格式的球队名单，要给一个在线报名系统填表。以前这是复制粘贴的地狱。

现在？"用名单里的信息，帮我报名，填上他们的名字和位置。"

Gemini 从 PDF 里提取数据，自动填进表单字段。手工活，自动化了。

想象一下这个场景：你想去大理旅游，但你懒得翻携程、看去哪儿、查攻略。你只需要对侧边栏的 Gemini 说：“帮我查下 3 月中旬上海去大理最便宜的机票，顺便搜下双廊附近 500 元以内、评分 4.5 以上、带露台的民宿。”

接下来神奇的一幕发生了：浏览器会自动开启一个新的“发光分页”，你能看到它自己在搜索框打字、自己在点鼠标、划屏幕、翻页面。它不是在调用 API，而是在像人一样替你上网。查完之后，它会在侧边栏给你列出一张清晰的对比表，甚至连预订表单都能帮你填好大半，你只需要点个“支付”。这哪是浏览器啊，这简直是请了个全能小秘书。😂

视觉购物：看图下单，预算可控

最后一个演示，是我觉得最"未来感"的一个。

场景是这样的：用户看到一张 Y2K 风格派对布置的照片（就是那种千禧年复古风），想复刻这个布置。

以前怎么做？自己盯着图，分析里面有什么东西——气球、彩带、背景布、装饰道具……然后一个一个去电商网站搜，比价，加购物车，算总价，超预算了再删几个……

现在呢？你跟 Gemini 说：

"去 Etsy，帮我找到能复刻这个布置的东西，加到购物车，预算不超过 75 美元。"

Gemini 先用 Gemini 3 的多模态能力分析图片内容（气球是什么颜色、背景帘是什么款式、有哪些道具），然后去 Etsy 搜索对应商品，自己比价，自己控制预算，最后把商品加进购物车。

更绝的是，官方还提到：Gemini 会自动帮你找优惠码并应用上去。

你打开购物车的时候，发现东西都选好了，总价正好卡在预算线上，优惠码也用上了。

从"我想要这个效果"到"购物车已就绪"，一句话的事儿。

这不是"帮你搜东西"，这是"帮你买东西"。购物体验直接跳过了中间所有的繁琐步骤。

小互的思考：这背后的狠招是什么？

我觉得，这次升级其实暴露了Google 的一个阳谋：它想把浏览器变成 AI 时代的新型操作系统，从而截杀所有想分流的对手。

为什么这么说？以前我们要用 AI，可能会去搜 ChatGPT，或者去用 Arc 这种号称“AI 浏览器”的新玩意。

Google 这一波操作，意思很明确：

既然全球 60% 以上的人都在用 Chrome，那我为什么不直接把 AI 变成空气呢？

它要让你形成一种“肌肉记忆”——

凡事不决问地址栏，凡事想写点啥点右键。

这其实是在利用生态位进行防守反击。

还有一点是：

Gemini 3 开始布局 “Personal Intelligence（个人智能）”。

只要你授权，它能读你的 Gmail 邮件、看你的 Google 日历、翻你的云端硬盘。

这意味着它比你更懂你自己。

未来你将离不开它，迁移成本更加高！

它不再是在提供搜索结果，它是在直接提供决策结果。以前我们要搜“我的行程”，现在直接问它“我明天几点出发去机场最合适”，它能自动结合你的机票确认邮件、实时的交通路况、甚至明天的天气，直接给你一个最终答案。

这其实是一个非常恐怖的闭环。Google正在把你所有的数字生活都圈在 Chrome 这个金鱼缸里。

这曾经是 OpenAI 的主要竞争力，现在看来荡然无存了！

但这也有个潜在的代价，那就是你的浏览行为、你的历史记忆、你的搜索偏好，甚至你在网页上输入的每一个字，都在Google AI 的“喂养”之下。虽然效率起飞了，但这种隐私的“裸奔感”，换个角度看，其实挺让人唏嘘的。

我们是用一部分隐私和自主思考，换取了这种极致的便利。

其他你可能关心的一些问题

需要登录的网站？也能搞定

你可能会问：有些网站需要登录才能操作，Gemini 怎么办？

答案是：可以用 Google Password Manager。

如果你授权了，Gemini 可以用你保存在 Google 密码管理器里的账号，自动登录网站，然后继续执行任务。

当然，这个功能需要你主动授权，不是默认开启的。

安全机制：敏感操作会暂停确认

看到这里，你可能会有点担心：这么强的自动化能力，万一 AI 做错了怎么办？

Google 显然也想到了这个问题。

官方说，他们为 Auto Browse 设计了全新的安全防护机制，针对新型网络威胁做了专门的防御。

更重要的是，敏感操作会暂停并要求你确认。

比如：

下单付款前，会暂停，让你确认
在社交媒体发帖前，会暂停，让你确认
其他涉及隐私或金钱的操作，都会暂停

你始终掌握最终决定权。 Gemini 是帮你干活的，不是替你做决定的。

UCP 协议：让 AI 购物成为行业标准

这个信息可能比较技术，但值得一提。

Google 还宣布 Chrome 将支持一个叫 UCP（Universal Commerce Protocol，通用商务协议）的开放标准。

这个协议是 Google 和 Shopify、Etsy、Wayfair、Target 等行业巨头一起制定的，目的是让 AI 代理能够在各种电商平台上无缝地代表用户执行操作。

什么意思？就是说，未来不只是 Google 自己的服务，第三方电商平台也会支持这种"AI 代你下单"的模式。

这是一个行业级别的变化。AI 购物不再是某一家公司的专属功能，而是要变成整个电商生态的标准能力。

什么时候能用？在哪能用？

说了这么多，什么时候能用上？

53AI，企业落地大模型首选服务商

产品：场景落地咨询+大模型应用平台+行业解决方案

承诺：免费POC验证，效果达标后再合作。零风险落地应用大模型，已交付160+中大型企业

Google 王炸更新 Gemini 和 Chrome 合体 绞杀一切竞争对手...