免费POC, 零成本试错
AI知识库

53AI知识库

学习大模型的前沿技术与行业应用场景


我要投稿

即刻使用 Gemini 3 开始构建

发布日期:2025-11-19 15:16:26 浏览次数: 1545
作者:谷歌黑板报

微信搜一搜,关注“谷歌黑板报”

推荐语

Google最新推出的Gemini 3 Pro模型,在编程和智能体工作流程方面实现突破性进展,为开发者带来前所未有的效率提升。

核心内容:
1. Gemini 3 Pro在基准测试中的卓越表现
2. 与现有开发工具的无缝集成方案
3. 全新智能体开发平台Antigravity的功能介绍

杨芳贤
53AI创始人/腾讯云(TVP)最具价值专家

今天我们正式推出 Gemini 3,这是我们迄今为止最智能的模型,能够帮助用户实现任何创意。Gemini 3 Pro 基于最先进的推理技术,与之前的版本相比,它在所有主要的 AI 基准测试中都取得了无与伦比的结果,尤其是在编程方面也超越了 2.5 Pro,能够熟练地处理智能体工作流程和复杂的零样本任务。



Gemini 3 Pro 可以无缝融入现有的生产智能体和编程工作流程,同时还能实现从前无法实现的全新应用场景。它目前提供预览版,通过 Google AI Studio 和面向企业的 Vertex AI 中的 Gemini API ,对于20万令牌或更少令牌的提示词,输入价格为2 美元/百万令牌,输出价格为 12 美元/百万令牌。此外,它还可以通过您常用的开发工具在更广泛的生态系统中使用,并在 Google AI Studio 中提供带有速率限制的免费版。


智能体编程


开发者们正花费越来越多的时间,借助 AI 进行开发。在 Gemini 2.5 Pro 所提供的成功经验和用户反馈基础上,Gemini 3 Pro 将作为智能体编程模型的新基石,拓展实现边界。


Gemini 3 Pro 在 Terminal-Bench 2.0 测试中得分为 54.2%,该测试旨在评估模型通过终端操作计算机的工具使用能力。


除了 Gemini CLI、Android Studio 的智能体模式(Agent Mode)以及 Cursor、Cline、JetBrains、Manus 等其他编程产品之外,您还可以在我们新的智能体开发平台 Google Antigravity 中亲身体验该模型的强大性能。




“Cline 正在使用 Gemini 3 来为开发者集成开发环境(IDE)提供自主代码生成功能……Gemini 3 Pro 能够在整个代码库范围内处理复杂的长周期任务,并在多文件重构、调试会话和功能实现的各阶段保持上下文连贯。它比 Gemini 2.5 Pro 更有效地利用上下文,并解决了让其他领先模型都束手无策的问题。”


—— Nik Pash

Cline AI 负责人



Google Antigravity


为了进一步提升模型与集成开发环境(IDE)的协同方式,我们推出了 Google Antigravity,以展示基于 Gemini 3 所能实现的能力。它是一个智能体开发平台,并通过跨工作区管理智能体,使开发者能够在更高的任务导向层面进行操作,同时保留其核心的 AI IDE 体验。


这是一种更高效的开发方式:您充当架构师,与在编辑器、终端和浏览器中自主运作的智能体协同完成工作。这些智能体能够规划并执行复杂的软件任务,并通过清晰的产出向用户同步它们的工作进展。这全面提升了开发的各个环节——从功能搭建、UI 迭代、漏洞修复,到调研与报告生成。您可以访问 Google Antigravity 网站,免费下载公测预览版,该版本现已支持 MacOS、Windows 和 Linux 系统。


在 Google Antigravity 这款多人协作数字白板应用中,

你可以看到多个智能体并行构建内容。


Gemini API


随着 Gemini 3 的发布,我们正在推出一款客户端 bash 工具,让模型能够在智能体工作流中提出可通过命令行实现的任意任务所需的 shell 命令,用于完成诸如本地文件系统导航、推动开发流程以及自动化系统操作等任务。此外,我们还将上线一个托管服务器端 bash 工具,用于多语言代码生成和安全的原型开发。该工具现已在 Gemini API 中面向早期访问合作伙伴开放,不久将全面开放。


此外,Gemini 托管工具中的“Grounding with Google Search”和“URL context”功能现在可以与结构化输出相结合。这在构建需要抓取与提取数据、并将结果按特定格式输出以供后续智能体任务使用的场景中,尤其强大。


氛围编程(Vibe coding)


Gemini 3 Pro 释放了“氛围编程”的真正潜力,让自然语言作为唯一的语法。通过大幅提升对复杂指令的理解和深入的工具使用能力,该模型能够仅凭提示词,就将高层级的想法变成可交互的应用。它承担了多步骤规划和变成细节的繁杂工作,带来更丰富的视觉呈现和更深入的交互,让您可以专注于创意本身。


Gemini 3 Pro 在 WebDev Arena 排行榜上位列第一,

并取得了令人印象深刻的 1487 Elo。



“Gemini 3 出色的提示词遵循度极大地提升了 Emergent 全栈应用开发平台的性能,尤其是在 UI /前端工作流程中。我们在将 Gemini 3 的多步骤工具调用整合到我们的智能体代码开发设置中后,看到了令人难以置信的成果。”


——Madhav Jha

Emergent 联合创始人兼首席技术官



Google AI Studio


无论是仅凭单一提示词构建一款游戏,根据非结构化的语音备忘录生成一个交互式登录页,还是根据一张餐巾纸草图开发一个完整的应用程序,开发者们都能用 Gemini 3 将他们的想法变为现实。借助这款模型,我们将单一提示词生成能力提升到前所未有的水平。这意味着,您只需通过单一提示词,就能将想法转化为一个由 AI 驱动的应用程序,例如在 Google AI Studio 中构建的这款复古游戏。


在 Google AI Studio 中使用 Gemini 3 Pro 构建的零样本游戏


我们构建 Google AI Studio 的目标是:让其成为您从一个提示词到 AI 原生应用的最快路径。其中的构建模式(Build mode) 让您能够以前所未有的速度添加 AI 功能,并自动连接合适的模型和 API,而像“注释(annotation)”这类功能则能帮助您实现快速且直观的迭代修改。您现在就可以在 Google AI Studio 中开始使用 Gemini 3 进行构建。


多模态理解


Gemini 3 是全球范围内在复杂多模态理解方面表现最佳的模型,它在用于复杂图像推理的 MMMU-Pro 和用于视频理解的 Video MMMU 上均创下了新高。结合其智能性与 100 万令牌的上下文窗口,开发者在构建关键多模态应用场景时可以看到显著提升。为了更好地控制延迟和成本,您现在可以根据应用所需的视觉保真度,在 Gemini API 中更精细地配置多模态视觉处理。


视觉推理


Gemini 3 Pro 在文档理解方面处于业界领先地位,它超越了简单的光学字符识别(OCR),能够智能地处理复杂文档理解和推理任务。


您可以在我们的演示应用中,看到该模型的视觉理解、推理和编程能力,它能在 Google AI Studio 中将任何创意变为现实。


Gemini 3 Pro 仅凭一张图片,就能利用其视觉理解、推理和编程能力,将其转化为交互式网络体验。


空间推理


该模型在空间推理能力上的提升,也显著提升了其在具身推理任务(例如指向、轨迹预测和任务进度追踪)中的表现,从而为自动驾驶汽车、XR 设备和机器人技术领域解锁新应用场景。


它的空间推理能力也为桌面、移动设备和操作系统界面的智能屏幕理解提供了支持,为计算机使用智能体带来显著性能提升。该模型还能根据鼠标移动和屏幕注解来理解用户操作背后的意图,从而解锁了全新的体验(例如这款 Visual Computer 演示应用)。


Gemini 3 不仅能理解用户手绘的指令,还能基于对屏幕及其元素的空间推理,智能地执行相应的操作。


视频推理


Gemini 3 Pro 能够通过高帧率理解来捕捉快速动作,确保开发者绝不会错过快速移动场景中的关键时刻。除了速度之外,其长上下文回忆能力还能在跨越数小时的连续画面中构建连贯叙事,并准确捕捉关键细节。



“在我们的智能体视频推理和工具调用中,Gemini 3 为 Agent Opus 从三个方面提供了关键支持:速度,相比我们目前的实施方案,速度提升超过了 32%;精度,展现了其卓越的复杂指令执行能力和准确的结构化解码能力;可靠性,能够在避免常见幻觉错误的同时,管理长上下文推理并调用精细工具。”


——Jay Wu

OpusClip 联合创始人兼首席技术官



从今天起构建未来


Gemini 3 Pro 现已集成到许多开发者产品和工具中,能够无缝融入您现有的工作流程,同时解锁全新的编程方式。



使用 Gemini API 进行构建:

您可以立即通过 Google AI Studio 和面向企业的 Vertex AI 将 Gemini 3 Pro 集成到您的应用中。为了让模型具备更深层次的推理能力,我们在 API 中引入了新的思维级别和更精细的媒体分辨率参数,同时对思维特征进行更严格的验证。此更新对于在多轮对话中保留模型的思维至关重要。您可以查看 Developer Guide 了解更多技术细节,阅读 Prompting Guide 学习如何使用 Gemini 3 Pro 进行构建。


体验模型的智能体能力:

无论您是为 Android 应用添加 AI 原生功能、通过 Gemini CLI 自动化工作流程,还是在 Google Antigravity 中管理一组自主运行智能体,Gemini 3 Pro 都能为复杂的智能体架构提供所需的可靠性支撑。


使用 Gemini 3 Pro 进行氛围编程:

Google AI Studio 是将创意变为现实的最快途径。即刻在“构建模式(Build mode)”中开始,仅用提示词即可生成完整应用。如果您需要一些灵感构思,可以点击“I’m feeling lucky”,让 Gemini 3 Pro 在激发创意的同时完成代码实现。



软件行业格局正在发生改变。当前,AI 正在改变“谁在开发”以及“如何开发”,我们致力于在您需要的时刻提供支持——为您提供工具,以突破现有界限,实现无限可能。


这仅仅是 Gemini 3 时代的开始,但我们已经迫不及待地想看到您即将用 Gemini 3 Pro 创造的成果!


53AI,企业落地大模型首选服务商

产品:场景落地咨询+大模型应用平台+行业解决方案

承诺:免费POC验证,效果达标后再合作。零风险落地应用大模型,已交付160+中大型企业

联系我们

售前咨询
186 6662 7370
预约演示
185 8882 0121

微信扫码

添加专属顾问

回到顶部

加载中...

扫码咨询