微信扫码
添加专属顾问
我要投稿
Google 将 Gemini AI 深度整合进 Chrome,浏览器从此变身智能助手,彻底改变你的上网体验。 核心内容: 1. Chrome 与 Gemini 3 的深度融合,重构浏览器核心逻辑 2. 全新侧边栏功能实现多任务并行处理,无需切换标签页 3. 端侧 AI 支持直接修改网页图片,打通 Google 全家桶工作流
很多人一直吐槽 Google,Gemini 那么强了,人家都推出了AI浏览器,为什么Chrome 却一直还是原地踏步?Google 到底在干嘛?
现在它终于来了
Gemini 和 Chrome 合体了...
Google 刚刚发布了基于最新 Gemini 3 模型的 Chrome 重大更新,这不仅仅是一个插件或侧边栏的升级,而是对浏览器核心逻辑的重构。
Chrome 正在从一个被动的“网页浏览工具”,进化为一个能够主动思考、替你干活的“智能代理(Agentic AI)”。
说实话,以前咱们用 AI 得经历多少步骤?先开网页、登账号、想 Prompt,万一网速不给力还得转半天圈圈。要是想让 AI 总结个网页,还得在那儿苦哈哈地复制粘贴,简直麻烦得要死。
这次升级后,Chrome 基本上变成了 Gemini 的“完全体容器”。
Google 这次是打算把 AI 直接缝进你的浏览肌肉里,甚至要开启“无人驾驶”模式。
这就带大家看看,Google 这次到底在构思什么“大杀器”。👇
先文字长的,看视频介绍:
Google 给 Chrome 加了一个新的 侧边栏(Side Panel)。
Side Panel不只是一个简单的聊天框,它变成了一个全能的指挥中心。
以前用 AI,你得切出去,复制粘贴,再切回来。现在?它就住在你手边
无论你打开哪个标签页,Gemini 都随时可用
而且最重要的是:它能看懂你在看什么
多任务处理神器:
你可以一边在主页面写方案、看资料,一边让侧边栏里的 Gemini 去对比多个网站的产品信息、汇总评价、提炼结论。
比如你正在浏览几个不同的数码产品页面,你可以让侧边栏里的 Gemini 直接生成一个“横向对比表”,把这几个网页的参数全部抓取并整理出
这是 Google 在端侧 AI 上的新突破。
你可以在浏览器里直接对网页上的图片进行处理。
以前你想看看一件家具放在房间里是什么效果,得先下载图片、上传到编辑器、祈祷效果还行……现在不用了。
你可以直接指着屏幕上的图片,让 Gemini 修改...
比如你看到一个房间的照片,想看看它更换装修风格的样子,你可以说:"帮我把这个房间换成浅色现代风家具。"它就直接生成了。
不需要下载,不需要上传,所见即所改。
Gemini 和 Google 全家桶的联动也更深了。
演示里有个场景:你在看一份课程大纲(比如某个读书会的书单),需要给学习小组发一封邮件,介绍一下要读的书。
以前怎么做?
现在呢?你让 Gemini 读当前页面的大纲,然后说:
"从里面挑三本书,写个简短介绍,用真人秀的风格写,帮我起草一封邮件。"
Gemini 直接从当前页面提取信息,在侧边栏里把邮件写好,连书的简介都给你编好了(而且还是真人秀风格的,带点戏剧性)。
你全程不需要离开正在看的页面。 大纲在主窗口,邮件在侧边栏,一心二用,效率翻倍。
写完之后,它还可以调用 Gmail,直接一键发送。搞定。
这种"读当前页面 + 执行另一个任务"的能力,才是 AI 真正融入工作流的样子。
接下来这个功能,打工人狂喜。
Gemini 不只是跟 Chrome 联动,而是跟整个 Google 生态打通了。官方叫它 Connected Apps(关联应用)。
目前支持的应用包括:
这些应用可以在 Gemini 设置里一键开启。
这意味着啥?举个例子:
你要出差参加一个会议,需要订机票。
以前怎么做?翻邮件找会议时间 → 打开机票网站搜航班 → 比价 → 订票 → 再写邮件告诉同事你的到达时间……
现在呢?你跟 Gemini 说一句:"帮我查一下下周那个会议的时间,推荐几个航班,然后写封邮件告诉同事我的到达时间。"
Gemini 自己去翻你的邮件找会议详情,自己去 Google Flights 查航班,自己帮你起草邮件。
一句话,三件事,全搞定。
这个功能目前还在预告阶段,但听起来非常值得期待:Personal Intelligence(个人智能)。
允许 Chrome 记住你的偏好
记住过去的对话上下文
支持自定义指令
提供更“像你助理”的回答
简单说,就是 Gemini 会记住你之前的对话上下文,然后基于这些记忆,给你更个性化的回答。
比如你之前跟它聊过你喜欢什么风格的酒店、你的预算范围、你对航班时间的偏好……下次你再问它"帮我订个酒店",它就不会从零开始问你一堆问题,而是直接根据你的偏好给推荐。
从一个通用工具,变成一个懂你的私人助理。
当然,Google 强调这个功能是用户主动开启的,你可以选择连接哪些应用,也可以随时断开。隐私控制权在你手里。
好,前面都是开胃菜。接下来这个功能,才是这次更新的真正炸裂之处↓
这是我最想吹爆的功能,没有之一!
以前 AI 只能“动嘴”,现在它能“动手”了。这就是所谓的 AI 正式接管“方向盘”。
这是什么概念?
Gemini 不再只是"回答问题",而是真的能像人一样打开网页、点击按钮、填写表单、替你完成任务。
演示里,用户说:"我想去芝加哥,住某某酒店,帮我查一下这几个周末的价格,还有一些其他要求。"
Gemini 直接打开 Expedia,自己开新标签页,自己点日期选择器,自己筛选条件,最后把搜索结果整理好呈现给你。
不是给你一个链接让你自己去看,是它替你完成了整个搜索流程。
在 Redfin(美国找房网站)上,用户说:"帮我看看收藏夹里的公寓,把不允许养宠物的删掉,然后把 Gabriel 加为协作者。"
Gemini 打开收藏列表,点进每个房源,看细则,检查宠物政策,不符合的自动移除,最后还帮你邀请了室友。
一个小时的繁琐操作,变成一句话。
用户有一份 PDF 格式的球队名单,要给一个在线报名系统填表。以前这是复制粘贴的地狱。
现在?"用名单里的信息,帮我报名,填上他们的名字和位置。"
Gemini 从 PDF 里提取数据,自动填进表单字段。手工活,自动化了。
想象一下这个场景:你想去大理旅游,但你懒得翻携程、看去哪儿、查攻略。你只需要对侧边栏的 Gemini 说:“帮我查下 3 月中旬上海去大理最便宜的机票,顺便搜下双廊附近 500 元以内、评分 4.5 以上、带露台的民宿。”
接下来神奇的一幕发生了:浏览器会自动开启一个新的“发光分页”,你能看到它自己在搜索框打字、自己在点鼠标、划屏幕、翻页面。它不是在调用 API,而是在像人一样替你上网。查完之后,它会在侧边栏给你列出一张清晰的对比表,甚至连预订表单都能帮你填好大半,你只需要点个“支付”。这哪是浏览器啊,这简直是请了个全能小秘书。😂
最后一个演示,是我觉得最"未来感"的一个。
场景是这样的:用户看到一张 Y2K 风格派对布置的照片(就是那种千禧年复古风),想复刻这个布置。
以前怎么做?自己盯着图,分析里面有什么东西——气球、彩带、背景布、装饰道具……然后一个一个去电商网站搜,比价,加购物车,算总价,超预算了再删几个……
现在呢?你跟 Gemini 说:
"去 Etsy,帮我找到能复刻这个布置的东西,加到购物车,预算不超过 75 美元。"
Gemini 先用 Gemini 3 的多模态能力分析图片内容(气球是什么颜色、背景帘是什么款式、有哪些道具),然后去 Etsy 搜索对应商品,自己比价,自己控制预算,最后把商品加进购物车。
更绝的是,官方还提到:Gemini 会自动帮你找优惠码并应用上去。
你打开购物车的时候,发现东西都选好了,总价正好卡在预算线上,优惠码也用上了。
从"我想要这个效果"到"购物车已就绪",一句话的事儿。
这不是"帮你搜东西",这是"帮你买东西"。 购物体验直接跳过了中间所有的繁琐步骤。
我觉得,这次升级其实暴露了Google 的一个阳谋:它想把浏览器变成 AI 时代的新型操作系统,从而截杀所有想分流的对手。
为什么这么说?以前我们要用 AI,可能会去搜 ChatGPT,或者去用 Arc 这种号称“AI 浏览器”的新玩意。
Google 这一波操作,意思很明确:
既然全球 60% 以上的人都在用 Chrome,那我为什么不直接把 AI 变成空气呢?
它要让你形成一种“肌肉记忆”——
凡事不决问地址栏,凡事想写点啥点右键。
这其实是在利用生态位进行防守反击。
Gemini 3 开始布局 “Personal Intelligence(个人智能)”。
只要你授权,它能读你的 Gmail 邮件、看你的 Google 日历、翻你的云端硬盘。
这意味着它比你更懂你自己。
未来你将离不开它,迁移成本更加高!
它不再是在提供搜索结果,它是在直接提供决策结果。以前我们要搜“我的行程”,现在直接问它“我明天几点出发去机场最合适”,它能自动结合你的机票确认邮件、实时的交通路况、甚至明天的天气,直接给你一个最终答案。
这其实是一个非常恐怖的闭环。Google正在把你所有的数字生活都圈在 Chrome 这个金鱼缸里。
这曾经是 OpenAI 的主要竞争力,现在看来荡然无存了!
但这也有个潜在的代价,那就是你的浏览行为、你的历史记忆、你的搜索偏好,甚至你在网页上输入的每一个字,都在Google AI 的“喂养”之下。虽然效率起飞了,但这种隐私的“裸奔感”,换个角度看,其实挺让人唏嘘的。
我们是用一部分隐私和自主思考,换取了这种极致的便利。
你可能会问:有些网站需要登录才能操作,Gemini 怎么办?
答案是:可以用 Google Password Manager。
如果你授权了,Gemini 可以用你保存在 Google 密码管理器里的账号,自动登录网站,然后继续执行任务。
当然,这个功能需要你主动授权,不是默认开启的。
看到这里,你可能会有点担心:这么强的自动化能力,万一 AI 做错了怎么办?
Google 显然也想到了这个问题。
官方说,他们为 Auto Browse 设计了全新的安全防护机制,针对新型网络威胁做了专门的防御。
更重要的是,敏感操作会暂停并要求你确认。
比如:
你始终掌握最终决定权。 Gemini 是帮你干活的,不是替你做决定的。
这个信息可能比较技术,但值得一提。
Google 还宣布 Chrome 将支持一个叫 UCP(Universal Commerce Protocol,通用商务协议) 的开放标准。
这个协议是 Google 和 Shopify、Etsy、Wayfair、Target 等行业巨头一起制定的,目的是让 AI 代理能够在各种电商平台上无缝地代表用户执行操作。
什么意思?就是说,未来不只是 Google 自己的服务,第三方电商平台也会支持这种"AI 代你下单"的模式。
这是一个行业级别的变化。AI 购物不再是某一家公司的专属功能,而是要变成整个电商生态的标准能力。
说了这么多,什么时候能用上?
根据官方信息:
对于国内用户来说,可能需要自己想想办法。
但不管怎样,方向已经很清楚了:
AI 浏览器的时代,真的来了。
加入XiaoHu.ai 日报社群 每天获取最新的AI信息
____________
End.
感 谢 阅 读
点赞,转发,关注关注关注↓↓
53AI,企业落地大模型首选服务商
产品:场景落地咨询+大模型应用平台+行业解决方案
承诺:免费POC验证,效果达标后再合作。零风险落地应用大模型,已交付160+中大型企业
2026-01-29
不需要Mac mini,花一杯咖啡的钱几分钟开箱即用玩转 Clawdbot
2026-01-29
超越Skill?又一新技术让AI编码准确率从53%跃升至100%
2026-01-29
别问原理,直接喂饭:11 个生产级 Skill 仓库,拿走不谢
2026-01-29
燃尽、重启、爆火:Clawdbot 创始人的 35 分钟访谈实录
2026-01-28
Agent原生架构:Claude Code 后时代该如何构建智能体应用
2026-01-28
Agent Skill:让AI拥有"随身携带的专业操作手册"
2026-01-28
刚刚,阿里云上线Clawdbot全套云服务!
2026-01-28
Gemini 3「开眼」像素级操控!谷歌回应DeepSeek-OCR2
2026-01-10
2025-11-19
2026-01-24
2025-11-13
2025-11-03
2026-01-01
2025-12-09
2025-11-12
2026-01-26
2025-11-15
2026-01-28
2026-01-28
2026-01-28
2026-01-26
2026-01-26
2026-01-23
2026-01-23
2026-01-22