我要投稿

用AI重做一切？花两千给Google I/O 更新们去去水分

发布日期：2025-05-22 03:12:59 浏览次数： 2475

作者：卡尔的AI沃茨

微信搜一搜，关注“卡尔的AI沃茨”

这合理吗？（熬夜破防版）

今天凌晨更新的 Google 掏出了一大堆好东西，

但是在 CEO 皮查伊精准的刀法下，

分为了free($0)、pro（$19.99）、ultra($249.99) 三档的订阅套餐，看了一早上各种盘点，想要试试带原生音效的 AI 视频模型 Veo3，结果要先充1800，

大大小小23+个更新，体验入口、形式都不一致，这我能忍？OpenAI Pro 都不能让我每个月准时充，

于是我和我的钱包一拍即合，

将三个档位的账号都弄了一个，把这次更新分为了体验级，实用级、不差钱级。让大家可以清晰知道要不要订阅，以及订阅后能体验到百分之多少的新能力。

看看 veo3 生成的视频，自带音效，太值得听听了

01｜Gemini 2.5 模型四连

Gemini 2.5 Pro 的预览版已经上线几周了，

模型得分没话说，人类终极测试、AIME数学竞赛、MMMU（视频理解）等多个测试集已经超 OpenAI o3-mini、Claude 3.7 Sonnet、DeepSeek R1了。

But，这个模型目前免费用户用不了，Pro 可以用基础版，

Ultra 可以在 Gemini 2.5 Pro 基础上开启Deep Think模式。

简单来说，Deep Think 模式下 Gemini 2.5 Pro 支持生成多条推理链，交叉验证后，会把投票最高的一条作为答案。这个方法让 2.5 Pro 在 MMMU 上打败了 OpenAI o3。

虽然在 Ultra 套餐里面说了可以用，但是 deep think 目前还是大期货。

除了Pro外，Gemini 2.5 系列的编码之王就是 Flash 了，

好消息是所有套餐都可以用上。

现在已经可以在 ai studio 上用了预览版：

而且从指标上看，长文本和数据能力一骑绝尘，甚至超过了 Claude 3.7 sonnet。

还有还有，一个新的文本扩散模型 Gemini Diffusion,

与主流的、GPT 使用的 Transformer 框架不同，Diffusion 不直接生成文本，而是通过学习逐步细化噪声来生成。

这样的好处是推理速度可以达到每 12 秒 10095 token，是 flash 的3倍。

但这个模型就跟订阅套餐没啥关系了，需要申请等待列表（链接较长就放在评论区啦）

02｜AI搜索

这应该是这场发布会里最激进的更新了。

如果使用搜索的次数较多，

AI摘要（AI Overviews）这个功能应该不算陌生，当搜索一些事实性的问题的时候，在顶部的AI摘要会根据搜索结果生成概要以及信息来源，

可能是AI摘在过去一年带来了10%流量增长，

也可能是时间节点到了，苹果 Safari 明示要引入 AI 搜索的时候，Google 的市值蒸发了1兆830亿，

总之，传统的搜索网页被彻底否决了，

对话框形式的 AI Mode 正式上线，

且这个功能目前没有任何套餐限制。

发动钞能力的我也是前后体验了几十次，这篇文章的数据和事实性信息都是我跟 AI mode 对话得到的。

但体验上跟开了联网搜索的 Gemini 2.5 pro 没太大的区别。

不过比起 Deep Research（深度研究），

AI Mode 参考的信息源不算多。

至于发布会上说的可以通过过去搜索记录、邮件信息来个性化搜索、Deep Search（深度研究）等还没有看到。

除了文本输出，AI mode 本身还支持买门票、买衣服、订餐厅等操作，还可以尝试 AI 试衣：

讲完了最颠覆的，

那一定要说说最值钱的了。

03｜AI视频&生图

史上最贵的AI视频模型 veo2 引来了新一代：

veo3

没想到最核心的提升不是画质、逼真度、物理模拟性，而是原生音频。

之前的工作流是先生成无声视频，再让一个新的模型边看画面边配音，缺点就是容易音画不同步。veo3 生成的视频里可以自带背景音效、环境声，甚至是人物对话。

但是 veo3 真的太高贵了，只开放给 Ultra 用户，150的Pro用户只能用720p的 Veo2，

效果是真的强，我的感受是1800里有1400都是归veo3的。坏消息是能力变强了，价格一点没下降，

假设一条视频都没浪费，一个月也就能生成80个。

跟veo3一起出来的是AI视频工作台flow，

Pro 和 Ultra 用户都能用

类似于 OpeAI Sora 的故事版，支持视频生成、剪辑和延长，

等我多玩几天玩明白了，再做一期veo3专题

? labs.google/fx/tools/flow

除了视频外，

这次imagen4还把图片质量追回来了，更新了图片里的文本效果，

更6的是，出图功能不消耗积分，可以无限制生图。

我拿 gpt4o 的提示语试了一下

? labs.google/fx/zh/tools/whisk

不过就目前测试下看的话，不太会写中文。

对了，Pro 用户目前用不了 Imagen4 。。。

04｜AI播客

AI 播客就是 NoteBookLM 带起来的，前段时间也支持上了中文，

移动端早就应该做了，

目前登陆了安卓和ios平台，可以随机将链接转成笔记和知识。

05｜跟订阅无关的更新们

Agent Project Mariner

相当于 OpenAI Operator，浏览器使用 Browser Use 的升级版，

Mariner 现在可以同时执行10个任务，而且还学会了 RPA 那套，我成功操作一次，Mariner 就可以重复运行，

不过目前只通过 API 开放给开发者，

还不是非常清楚是不是通过操作的视频来学习如何操作软件，

蹲个后续吧。

? deepmind.google/models/project-mariner/

AI编程 Jules

对标隔壁 OpenAI CodeX，

能修复 Bug、更新版本、编写测试、写代码等等。每天提供5次免费任务。

Android XR 智能眼镜

跟 Xreal 合作推出的支持安卓 XR 的智能眼镜，支持实时导航、翻译和摄像功能，不过现场演示的时候卡住了。。。

Project Moohan 头显

跟三星联动，第一台安卓XR设备，长得果里果气的。

认得出哪个是 Apple Vision Pro 吗？

3D视频通话 Beam

通过六个摄像头组成的矩阵来扫描用户，实现每秒60帧的毫米级精度实时头部追踪

这些更新就跟订阅没太大关系了，大部分都处于是早期体验状态。

写在最后

呼！

盘点完后心念通达多了，

现在这个阶段的1800基本就是为了 veo3 服务的，

还记得 I/O 2024的时候，

Google 被 OpenAI 的 GPT-4o 打到抬不起头，

今年，轮到 GPT5 还没放出来，没能顺利截胡这一大堆更新了，

现在，我反而是希望I/O 2026能不能学学OpenAI，多开几场，

给我留点试玩的时间，

这么多好东西，一股脑放出来，还是有些东西容易被错过了，

毕竟AI更新已经那么快了，

你Google质量都这么高了，

不那么卷，peace一点也是可以的。

53AI，企业落地大模型首选服务商

产品：场景落地咨询+大模型应用平台+行业解决方案

承诺：免费POC验证，效果达标后再合作。零风险落地应用大模型，已交付160+中大型企业

相关资讯

2026-05-27

我把 OpenAI Codex 官方案例全跑了一遍

2026-05-27

一个Agent工程师听完VC的2小时播客后想通的事

2026-05-27

考虑把 Claude Code 全量切换到 Grok Build 了

2026-05-27

从透明开发到系统工程：AgentScope 2.0 发布

2026-05-27

大神Karpathy 发明 autoresearch，仅用 Markdown 就做出了自动化研究循环

2026-05-27

Claude Code 新安全插件：写代码时先拦漏洞

2026-05-26

Routa 桌面版发布：内建 Harness 工程的 AI Coding 研发协作工作台

2026-05-26

面壁智能BitCPM-CANN：端侧AI的内存革命

联系获取

160+中大型企业正在使用53AI

立即咨询预约演示

把握AI发展的机遇，共同探索、共同进步

2025-01-22

如何打造基于GenAI的员工服务机器人

2025-01-22

热点资讯

Claude Opus 4.7刚刚曝光！Claude Code一夜重构，7x24小时替你打工

2026-04-15

OpenAI Codex CLI 完整使用指南

2026-04-07

刚刚Qwen 3.6 Plus上线预览：1M上下文，阿里Coding/Agent翻身战打响

2026-03-31

2026年国内如何注册 Claude 账号教程

2026-03-13

Claude Code 和 Codex 接入 Figma MCP 保姆级教程

2026-04-07

独家| DeepSeek-V4终于要来了：梁文锋憋半年大招，多模态+长期记忆全面破局

2026-03-17

香港终于能直接用 Gemini 了，内地用户能用上吗？

2026-03-17

编程选GPT-5.4，还是GPT-5.3-Codex？

2026-03-21

GPT5.5来了，最大特点解析

2026-04-24

刚刚，GPT-5.4 发布，百万上下文、最强全能模型

2026-03-06

大家都在问

如何使用Codex的Goals机制完成长程任务？

2026-05-26

Codex 的 computer use 功能，为什么这么好用？

2026-05-23

前有用友YonClaw，今有金蝶灵基，中国软件双雄的AI底牌谁能笑到最后？

2026-05-21

Harness Engineering：AI 能在真正"出事会炸"的后端系统里写代码吗？

2026-05-19

谁来给企业端即将大规模入职的Agent盖办公室？

2026-05-09

鹅厂员工觉得好的code模型应该具备什么能力？

2026-05-09

Markdown要被抛弃了？Claude Code工程师自曝：我已彻底放弃使用Markdown！团队倾向使用HTML！网友：其他编辑工具会被淘汰吗？

2026-05-09

AI吞噬软件的叙事要分化了？

2026-05-08

热门标签

内容创作大模型技术个人提效 langchain llamaindex 多模态技术 RAG技术智能客服知识图谱模型微调 RAGFlow coze Dify Fastgpt Bisheng Qanything AI+汽车 AI+金融 AI+工业 AI+培训 AI+SaaS Skill 提示词技巧 AI+电商 AI面试数字员工 ChatBI AI知识库开源大模型智能营销智能硬件 FDE AI+医疗 MaxKB Palantir Glean Openclaw