微信扫码
添加专属顾问
我要投稿
谷歌AI技术迎来革命性突破,引领行业新浪潮!核心内容:1. Google I/O 2025大会宣布全面AI化战略,发布多项创新服务2. Gemini Live实现实时语音对话与视觉流式传输,大幅提升办公效率3. Veo 3、Imagen 4、Flow三大AI模型,革新视频生成与图像渲染技术
(这张图是叫Gemini帮我画的)
ChatGPT发布以来,通用性人工智能的飞速发展,正在逐渐改变我们的生活。而在这一波AI浪潮中,Google好像一直都是略微被忽略的那一个。虽然作为当前大模型基础架构之一的Transformer架构最早是在Google诞生的,但是Google的AI却始终缺乏一个爆发点,不温不火的。前不久更是传出苹果试图在Safari中接入AI搜索时,Google的股价出现了相当幅度的下跌。
而前几天的 Google I / O 2025 大会,似乎宣布了Google的王者归来。
Google 在 Google I / O 2025 大会中,发布了上面图片中的服务。提供对谷歌人工智能应用和服务的"最高级别访问",订阅费用为每月249.99美元。在这次发布会中,谷歌宣布全面AI化。
这篇文章会梳理一下,我认为比较有意思的一些更新。
用户 可以与 Gemini 进行近乎实时的语音对话,同时将智能手机的摄像头或屏幕画面流式传输到人工智能模型。
直接来看一个视频:
未来几周,Gemini Live还将更深入地与其他应用集成:很快就能提供谷歌地图的导航指引、在谷歌日历中创建事件,并通过谷歌任务生成待办事项列表。
谷歌还表示,将更新Deep Research(Gemini生成详细研究报告的人工智能代理),允许用户上传自己的私人PDF和图像。同时,允许 Gemini 在用户授权下,从邮件和云端硬盘中提取相关数据,进行多文档比对与智能回答。
这次更新,将大大提高谷歌在办公场景(邮件、Google Doc)下的AI化能力,全面提升办公效率。
谷歌推出的Veo 3可以生成音效、背景噪音甚至对话来配合其创建的视频。谷歌表示,Veo 3在生成视频的质量方面比其前身Veo 2有所提升。从本次大会开始,订阅谷歌每月249.99美元AI Ultra计划的用户可在Gemini聊天机器人应用中使用Veo 3,用户可以通过文本或图像进行提示。
我从互联网上找了一个其他用户生成的视频:
谷歌表示,Imagen 4的速度比Imagen 3更快,而且很快会变得更快。在不久的将来,谷歌计划发布一个比Imagen 3快10倍的Imagen 4变体。
据谷歌介绍,Imagen 4能够渲染织物、水滴和动物皮毛等"精细细节",可以处理写实和抽象风格,生成各种纵横比、最高2K分辨率的图像。
谷歌推出了一款全新的AI电影创作应用程序Flow。该工具结合了Veo、Imagen和Gemini技术,能够根据文字提示或图像生成时长约八秒的AI视频片段。Flow同时配备了场景构建工具,用户可以将多个片段拼接组合,创作出更长、更具连贯性的AI影片,从而大幅提升创作效率与表达自由度。
Project Mariner是谷歌的实验性AI Agent,可浏览和使用网站。谷歌表示,已大幅更新其工作方式,允许代理一次处理近十二项任务,目前正在向用户推出。
例如,Project Mariner用户无需访问第三方网站,即可购买棒球比赛门票或在线购买杂货,只需与谷歌的人工智能代理聊天,它就会访问网站并代用户执行操作。
用户可以上传一张自己的照片,AI会生成你穿上衣服后的效果图。
Chrome浏览器,也全面转向AI化。Chrome推出了Gemini,帮助用户快速理解网页内容并完成任务。
当AI搜索正在逐步抢占传统的搜索时,Google 自己也推出了 AI Search
此外,在本次发布会中,Google 还发布了一些硬件设备,包括 Google Beam(原Project Starline),Project Astra与XR眼镜等,还有一些其他的更新,比如 Gmail智能回复升级、Google Meet实时翻译、NotebookLM 更新,等等。
凭借Google强大的生态,再加上AI的全面赋能,Google 这一次能否上演王者归来呢?让我们拭目以待。
53AI,企业落地大模型首选服务商
产品:场景落地咨询+大模型应用平台+行业解决方案
承诺:免费场景POC验证,效果验证后签署服务协议。零风险落地应用大模型,已交付160+中大型企业
2025-05-24
DeepChat 0.2.0 重磅发布:多窗口AI工作台,让智能对话如虎添翼!
2025-05-24
AI Agent:大模型带来的“颠覆”与“后发先至”
2025-05-24
由红杉 AI 峰会闭门会引发的部分思考
2025-05-24
Claude 4 正式发布:Anthropic 新一代模型能力详解+附赠最佳实践指南
2025-05-24
Anthropic新AI旗舰模型Claude 4能力详解:全力拓展AI智能体的能力边界
2025-05-23
大模型 Agent 就是文字艺术吗?
2025-05-23
每位AI工程师都应了解的A2A、MCP与ACP协议
2025-05-23
今天的Agent,就是十年前的小程序?
2024-08-13
2024-06-13
2024-08-21
2024-09-23
2024-07-31
2024-05-28
2024-08-04
2024-04-26
2024-07-09
2024-09-17
2025-05-23
2025-05-23
2025-05-23
2025-05-18
2025-05-18
2025-05-17
2025-05-13
2025-05-13