免费POC, 零成本试错
AI知识库

53AI知识库

学习大模型的前沿技术与行业应用场景


我要投稿

Google 王炸更新 Gemini 和 Chrome 合体 绞杀一切竞争对手...

发布日期:2026-01-29 10:22:56 浏览次数: 1548
作者:小互AI

微信搜一搜,关注“小互AI”

推荐语

Google 将 Gemini AI 深度整合进 Chrome,浏览器从此变身智能助手,彻底改变你的上网体验。

核心内容:
1. Chrome 与 Gemini 3 的深度融合,重构浏览器核心逻辑
2. 全新侧边栏功能实现多任务并行处理,无需切换标签页
3. 端侧 AI 支持直接修改网页图片,打通 Google 全家桶工作流

杨芳贤
53AI创始人/腾讯云(TVP)最具价值专家

很多人一直吐槽 Google,Gemini 那么强了,人家都推出了AI浏览器,为什么Chrome 却一直还是原地踏步?Google 到底在干嘛?

现在它终于来了

Gemini 和 Chrome 合体了...

Google 刚刚发布了基于最新 Gemini 3 模型的 Chrome 重大更新,这不仅仅是一个插件或侧边栏的升级,而是对浏览器核心逻辑的重构。

Chrome 正在从一个被动的“网页浏览工具”,进化为一个能够主动思考、替你干活的“智能代理(Agentic AI)”。

说实话,以前咱们用 AI 得经历多少步骤?先开网页、登账号、想 Prompt,万一网速不给力还得转半天圈圈。要是想让 AI 总结个网页,还得在那儿苦哈哈地复制粘贴,简直麻烦得要死。

这次升级后,Chrome 基本上变成了 Gemini 的“完全体容器”。

Google 这次是打算把 AI 直接缝进你的浏览肌肉里,甚至要开启“无人驾驶”模式。

这就带大家看看,Google 这次到底在构思什么“大杀器”。👇

先文字长的,看视频介绍:

Side Panel:从“弹窗”变成“常驻协作者”

Google 给 Chrome 加了一个新的 侧边栏(Side Panel)

Side Panel不只是一个简单的聊天框,它变成了一个全能的指挥中心。

以前用 AI,你得切出去,复制粘贴,再切回来。现在?它就住在你手边

无论你打开哪个标签页,Gemini 都随时可用

而且最重要的是:它能看懂你在看什么


多任务处理神器:

你可以一边在主页面写方案、看资料,一边让侧边栏里的 Gemini 去对比多个网站的产品信息、汇总评价、提炼结论。

比如你正在浏览几个不同的数码产品页面,你可以让侧边栏里的 Gemini 直接生成一个“横向对比表”,把这几个网页的参数全部抓取并整理出

  • 你可以在主页面继续当前工作
  • 同时在侧边栏让 Gemini 处理另一项任务
  • 不打断、不切换、不复制粘贴

内置Nano Banana:屏幕上的图片,直接改

这是 Google 在端侧 AI 上的新突破。

你可以在浏览器里直接对网页上的图片进行处理。

以前你想看看一件家具放在房间里是什么效果,得先下载图片、上传到编辑器、祈祷效果还行……现在不用了。

你可以直接指着屏幕上的图片,让 Gemini 修改...

比如你看到一个房间的照片,想看看它更换装修风格的样子,你可以说:"帮我把这个房间换成浅色现代风家具。"它就直接生成了。

不需要下载,不需要上传,所见即所改。

Google Workspace 深度打通

Gemini 和 Google 全家桶的联动也更深了。

演示里有个场景:你在看一份课程大纲(比如某个读书会的书单),需要给学习小组发一封邮件,介绍一下要读的书。

以前怎么做?

  1. 1.看大纲,记住书名
  2. 2.切到 Gmail,新建邮件
  3. 3.切回大纲,复制书名
  4. 4.切到 Gmail,粘贴
  5. 5.想写介绍?再去搜一下这本书讲什么
  6. 6.来回切换到头晕……

现在呢?你让 Gemini 读当前页面的大纲,然后说:

"从里面挑三本书,写个简短介绍,用真人秀的风格写,帮我起草一封邮件。"

Gemini 直接从当前页面提取信息,在侧边栏里把邮件写好,连书的简介都给你编好了(而且还是真人秀风格的,带点戏剧性)。

你全程不需要离开正在看的页面。 大纲在主窗口,邮件在侧边栏,一心二用,效率翻倍。

写完之后,它还可以调用 Gmail,直接一键发送。搞定。

这种"读当前页面 + 执行另一个任务"的能力,才是 AI 真正融入工作流的样子。

Connected Apps:Google 全家桶深度打通

接下来这个功能,打工人狂喜。

Gemini 不只是跟 Chrome 联动,而是跟整个 Google 生态打通了。官方叫它 Connected Apps(关联应用)。

目前支持的应用包括:

  • Gmail(邮件)
  • Google Calendar(日历)
  • YouTube
  • Google Maps(地图)
  • Google Shopping(购物)
  • Google Flights(航班)

这些应用可以在 Gemini 设置里一键开启。

这意味着啥?举个例子:

你要出差参加一个会议,需要订机票。

以前怎么做?翻邮件找会议时间 → 打开机票网站搜航班 → 比价 → 订票 → 再写邮件告诉同事你的到达时间……

现在呢?你跟 Gemini 说一句:"帮我查一下下周那个会议的时间,推荐几个航班,然后写封邮件告诉同事我的到达时间。"

Gemini 自己去翻你的邮件找会议详情,自己去 Google Flights 查航班,自己帮你起草邮件。

一句话,三件事,全搞定。

个人智能 Personal Intelligence:越用越懂你

这个功能目前还在预告阶段,但听起来非常值得期待:Personal Intelligence(个人智能)

允许 Chrome 记住你的偏好

记住过去的对话上下文

支持自定义指令

提供更“像你助理”的回答

简单说,就是 Gemini 会记住你之前的对话上下文,然后基于这些记忆,给你更个性化的回答。

比如你之前跟它聊过你喜欢什么风格的酒店、你的预算范围、你对航班时间的偏好……下次你再问它"帮我订个酒店",它就不会从零开始问你一堆问题,而是直接根据你的偏好给推荐。

从一个通用工具,变成一个懂你的私人助理。

当然,Google 强调这个功能是用户主动开启的,你可以选择连接哪些应用,也可以随时断开。隐私控制权在你手里。

真正的核武:Auto Browse(自动浏览)上线!

好,前面都是开胃菜。接下来这个功能,才是这次更新的真正炸裂之处↓

 Gemini 开始"接管方向盘"

这是我最想吹爆的功能,没有之一!

以前 AI 只能“动嘴”,现在它能“动手”了。这就是所谓的 AI 正式接管“方向盘”。

这是什么概念?

Gemini 不再只是"回答问题",而是真的能像人一样打开网页、点击按钮、填写表单、替你完成任务

场景一:订酒店

演示里,用户说:"我想去芝加哥,住某某酒店,帮我查一下这几个周末的价格,还有一些其他要求。"

Gemini 直接打开 Expedia,自己开新标签页,自己点日期选择器,自己筛选条件,最后把搜索结果整理好呈现给你。

不是给你一个链接让你自己去看,是它替你完成了整个搜索流程

场景二:筛选公寓

在 Redfin(美国找房网站)上,用户说:"帮我看看收藏夹里的公寓,把不允许养宠物的删掉,然后把 Gabriel 加为协作者。"

Gemini 打开收藏列表,点进每个房源,看细则,检查宠物政策,不符合的自动移除,最后还帮你邀请了室友。

一个小时的繁琐操作,变成一句话。

场景三:填表格

用户有一份 PDF 格式的球队名单,要给一个在线报名系统填表。以前这是复制粘贴的地狱。

现在?"用名单里的信息,帮我报名,填上他们的名字和位置。"

Gemini 从 PDF 里提取数据,自动填进表单字段。手工活,自动化了。

想象一下这个场景:你想去大理旅游,但你懒得翻携程、看去哪儿、查攻略。你只需要对侧边栏的 Gemini 说:“帮我查下 3 月中旬上海去大理最便宜的机票,顺便搜下双廊附近 500 元以内、评分 4.5 以上、带露台的民宿。”

接下来神奇的一幕发生了:浏览器会自动开启一个新的“发光分页”,你能看到它自己在搜索框打字、自己在点鼠标、划屏幕、翻页面。它不是在调用 API,而是在像人一样替你上网。查完之后,它会在侧边栏给你列出一张清晰的对比表,甚至连预订表单都能帮你填好大半,你只需要点个“支付”。这哪是浏览器啊,这简直是请了个全能小秘书。😂

视觉购物:看图下单,预算可控

最后一个演示,是我觉得最"未来感"的一个。

场景是这样的:用户看到一张 Y2K 风格派对布置的照片(就是那种千禧年复古风),想复刻这个布置。

以前怎么做?自己盯着图,分析里面有什么东西——气球、彩带、背景布、装饰道具……然后一个一个去电商网站搜,比价,加购物车,算总价,超预算了再删几个……

现在呢?你跟 Gemini 说:

"去 Etsy,帮我找到能复刻这个布置的东西,加到购物车,预算不超过 75 美元。"

Gemini 先用 Gemini 3 的多模态能力分析图片内容(气球是什么颜色、背景帘是什么款式、有哪些道具),然后去 Etsy 搜索对应商品,自己比价,自己控制预算,最后把商品加进购物车。

更绝的是,官方还提到:Gemini 会自动帮你找优惠码并应用上去。

你打开购物车的时候,发现东西都选好了,总价正好卡在预算线上,优惠码也用上了。

从"我想要这个效果"到"购物车已就绪",一句话的事儿。

这不是"帮你搜东西",这是"帮你买东西"。 购物体验直接跳过了中间所有的繁琐步骤。

小互的思考:这背后的狠招是什么?

我觉得,这次升级其实暴露了Google 的一个阳谋:它想把浏览器变成 AI 时代的新型操作系统,从而截杀所有想分流的对手。

为什么这么说?以前我们要用 AI,可能会去搜 ChatGPT,或者去用 Arc 这种号称“AI 浏览器”的新玩意。

Google 这一波操作,意思很明确:

既然全球 60% 以上的人都在用 Chrome,那我为什么不直接把 AI 变成空气呢?

它要让你形成一种“肌肉记忆”——

凡事不决问地址栏,凡事想写点啥点右键。

这其实是在利用生态位进行防守反击。

还有一点是:

Gemini 3 开始布局 “Personal Intelligence(个人智能)”

只要你授权,它能读你的 Gmail 邮件、看你的 Google 日历、翻你的云端硬盘。

这意味着它比你更懂你自己。

未来你将离不开它,迁移成本更加高!

它不再是在提供搜索结果,它是在直接提供决策结果。以前我们要搜“我的行程”,现在直接问它“我明天几点出发去机场最合适”,它能自动结合你的机票确认邮件、实时的交通路况、甚至明天的天气,直接给你一个最终答案。

这其实是一个非常恐怖的闭环。Google正在把你所有的数字生活都圈在 Chrome 这个金鱼缸里。

这曾经是 OpenAI 的主要竞争力,现在看来荡然无存了!

但这也有个潜在的代价,那就是你的浏览行为、你的历史记忆、你的搜索偏好,甚至你在网页上输入的每一个字,都在Google  AI 的“喂养”之下。虽然效率起飞了,但这种隐私的“裸奔感”,换个角度看,其实挺让人唏嘘的。

我们是用一部分隐私和自主思考,换取了这种极致的便利。

其他你可能关心的一些问题

需要登录的网站?也能搞定

你可能会问:有些网站需要登录才能操作,Gemini 怎么办?

答案是:可以用 Google Password Manager。

如果你授权了,Gemini 可以用你保存在 Google 密码管理器里的账号,自动登录网站,然后继续执行任务。

当然,这个功能需要你主动授权,不是默认开启的。

安全机制:敏感操作会暂停确认

看到这里,你可能会有点担心:这么强的自动化能力,万一 AI 做错了怎么办?

Google 显然也想到了这个问题。

官方说,他们为 Auto Browse 设计了全新的安全防护机制,针对新型网络威胁做了专门的防御。

更重要的是,敏感操作会暂停并要求你确认

比如:

  • 下单付款前,会暂停,让你确认
  • 在社交媒体发帖前,会暂停,让你确认
  • 其他涉及隐私或金钱的操作,都会暂停

你始终掌握最终决定权。 Gemini 是帮你干活的,不是替你做决定的。

UCP 协议:让 AI 购物成为行业标准

这个信息可能比较技术,但值得一提。

Google 还宣布 Chrome 将支持一个叫 UCP(Universal Commerce Protocol,通用商务协议) 的开放标准。

这个协议是 Google 和 Shopify、Etsy、Wayfair、Target 等行业巨头一起制定的,目的是让 AI 代理能够在各种电商平台上无缝地代表用户执行操作

什么意思?就是说,未来不只是 Google 自己的服务,第三方电商平台也会支持这种"AI 代你下单"的模式。

这是一个行业级别的变化。AI 购物不再是某一家公司的专属功能,而是要变成整个电商生态的标准能力。

什么时候能用?在哪能用?

说了这么多,什么时候能用上?

根据官方信息:

  • 平台:MacOS、Windows、Chromebook Plus
  • 地区:目前仅限美国
  • 用户:Auto Browse 功能需要 Google AI Pro 或 Ultra 订阅
  • Nano Banana:所有 Gemini in Chrome 用户都能用

对于国内用户来说,可能需要自己想想办法。

但不管怎样,方向已经很清楚了:

AI 浏览器的时代,真的来了。

加入XiaoHu.ai 日报社群 每天获取最新的AI信息


图片

____________

End.

感 谢 阅 

点赞,转发,关注关注关注↓↓


53AI,企业落地大模型首选服务商

产品:场景落地咨询+大模型应用平台+行业解决方案

承诺:免费POC验证,效果达标后再合作。零风险落地应用大模型,已交付160+中大型企业

联系我们

售前咨询
186 6662 7370
预约演示
185 8882 0121

微信扫码

添加专属顾问

回到顶部

加载中...

扫码咨询