微信扫码
添加专属顾问
我要投稿
Google最新推出的Gemini 3 Pro模型,在编程和智能体工作流程方面实现突破性进展,为开发者带来前所未有的效率提升。 核心内容: 1. Gemini 3 Pro在基准测试中的卓越表现 2. 与现有开发工具的无缝集成方案 3. 全新智能体开发平台Antigravity的功能介绍
今天我们正式推出 Gemini 3,这是我们迄今为止最智能的模型,能够帮助用户实现任何创意。Gemini 3 Pro 基于最先进的推理技术,与之前的版本相比,它在所有主要的 AI 基准测试中都取得了无与伦比的结果,尤其是在编程方面也超越了 2.5 Pro,能够熟练地处理智能体工作流程和复杂的零样本任务。
Gemini 3 Pro 可以无缝融入现有的生产智能体和编程工作流程,同时还能实现从前无法实现的全新应用场景。它目前提供预览版,通过 Google AI Studio 和面向企业的 Vertex AI 中的 Gemini API ,对于20万令牌或更少令牌的提示词,输入价格为2 美元/百万令牌,输出价格为 12 美元/百万令牌。此外,它还可以通过您常用的开发工具在更广泛的生态系统中使用,并在 Google AI Studio 中提供带有速率限制的免费版。
智能体编程
开发者们正花费越来越多的时间,借助 AI 进行开发。在 Gemini 2.5 Pro 所提供的成功经验和用户反馈基础上,Gemini 3 Pro 将作为智能体编程模型的新基石,拓展实现边界。
Gemini 3 Pro 在 Terminal-Bench 2.0 测试中得分为 54.2%,该测试旨在评估模型通过终端操作计算机的工具使用能力。
除了 Gemini CLI、Android Studio 的智能体模式(Agent Mode)以及 Cursor、Cline、JetBrains、Manus 等其他编程产品之外,您还可以在我们新的智能体开发平台 Google Antigravity 中亲身体验该模型的强大性能。
Google Antigravity
为了进一步提升模型与集成开发环境(IDE)的协同方式,我们推出了 Google Antigravity,以展示基于 Gemini 3 所能实现的能力。它是一个智能体开发平台,并通过跨工作区管理智能体,使开发者能够在更高的任务导向层面进行操作,同时保留其核心的 AI IDE 体验。
这是一种更高效的开发方式:您充当架构师,与在编辑器、终端和浏览器中自主运作的智能体协同完成工作。这些智能体能够规划并执行复杂的软件任务,并通过清晰的产出向用户同步它们的工作进展。这全面提升了开发的各个环节——从功能搭建、UI 迭代、漏洞修复,到调研与报告生成。您可以访问 Google Antigravity 网站,免费下载公测预览版,该版本现已支持 MacOS、Windows 和 Linux 系统。
在 Google Antigravity 这款多人协作数字白板应用中,
你可以看到多个智能体并行构建内容。
Gemini API
随着 Gemini 3 的发布,我们正在推出一款客户端 bash 工具,让模型能够在智能体工作流中提出可通过命令行实现的任意任务所需的 shell 命令,用于完成诸如本地文件系统导航、推动开发流程以及自动化系统操作等任务。此外,我们还将上线一个托管服务器端 bash 工具,用于多语言代码生成和安全的原型开发。该工具现已在 Gemini API 中面向早期访问合作伙伴开放,不久将全面开放。
此外,Gemini 托管工具中的“Grounding with Google Search”和“URL context”功能现在可以与结构化输出相结合。这在构建需要抓取与提取数据、并将结果按特定格式输出以供后续智能体任务使用的场景中,尤其强大。
氛围编程(Vibe coding)
Gemini 3 Pro 释放了“氛围编程”的真正潜力,让自然语言作为唯一的语法。通过大幅提升对复杂指令的理解和深入的工具使用能力,该模型能够仅凭提示词,就将高层级的想法变成可交互的应用。它承担了多步骤规划和变成细节的繁杂工作,带来更丰富的视觉呈现和更深入的交互,让您可以专注于创意本身。
Gemini 3 Pro 在 WebDev Arena 排行榜上位列第一,
并取得了令人印象深刻的 1487 Elo。
Google AI Studio
无论是仅凭单一提示词构建一款游戏,根据非结构化的语音备忘录生成一个交互式登录页,还是根据一张餐巾纸草图开发一个完整的应用程序,开发者们都能用 Gemini 3 将他们的想法变为现实。借助这款模型,我们将单一提示词生成能力提升到前所未有的水平。这意味着,您只需通过单一提示词,就能将想法转化为一个由 AI 驱动的应用程序,例如在 Google AI Studio 中构建的这款复古游戏。
在 Google AI Studio 中使用 Gemini 3 Pro 构建的零样本游戏
我们构建 Google AI Studio 的目标是:让其成为您从一个提示词到 AI 原生应用的最快路径。其中的构建模式(Build mode) 让您能够以前所未有的速度添加 AI 功能,并自动连接合适的模型和 API,而像“注释(annotation)”这类功能则能帮助您实现快速且直观的迭代修改。您现在就可以在 Google AI Studio 中开始使用 Gemini 3 进行构建。
多模态理解
Gemini 3 是全球范围内在复杂多模态理解方面表现最佳的模型,它在用于复杂图像推理的 MMMU-Pro 和用于视频理解的 Video MMMU 上均创下了新高。结合其智能性与 100 万令牌的上下文窗口,开发者在构建关键多模态应用场景时可以看到显著提升。为了更好地控制延迟和成本,您现在可以根据应用所需的视觉保真度,在 Gemini API 中更精细地配置多模态视觉处理。
视觉推理
Gemini 3 Pro 在文档理解方面处于业界领先地位,它超越了简单的光学字符识别(OCR),能够智能地处理复杂文档理解和推理任务。
您可以在我们的演示应用中,看到该模型的视觉理解、推理和编程能力,它能在 Google AI Studio 中将任何创意变为现实。
Gemini 3 Pro 仅凭一张图片,就能利用其视觉理解、推理和编程能力,将其转化为交互式网络体验。
空间推理
该模型在空间推理能力上的提升,也显著提升了其在具身推理任务(例如指向、轨迹预测和任务进度追踪)中的表现,从而为自动驾驶汽车、XR 设备和机器人技术领域解锁新应用场景。
它的空间推理能力也为桌面、移动设备和操作系统界面的智能屏幕理解提供了支持,为计算机使用智能体带来显著性能提升。该模型还能根据鼠标移动和屏幕注解来理解用户操作背后的意图,从而解锁了全新的体验(例如这款 Visual Computer 演示应用)。
Gemini 3 不仅能理解用户手绘的指令,还能基于对屏幕及其元素的空间推理,智能地执行相应的操作。
视频推理
Gemini 3 Pro 能够通过高帧率理解来捕捉快速动作,确保开发者绝不会错过快速移动场景中的关键时刻。除了速度之外,其长上下文回忆能力还能在跨越数小时的连续画面中构建连贯叙事,并准确捕捉关键细节。
从今天起构建未来
Gemini 3 Pro 现已集成到许多开发者产品和工具中,能够无缝融入您现有的工作流程,同时解锁全新的编程方式。
软件行业格局正在发生改变。当前,AI 正在改变“谁在开发”以及“如何开发”,我们致力于在您需要的时刻提供支持——为您提供工具,以突破现有界限,实现无限可能。
这仅仅是 Gemini 3 时代的开始,但我们已经迫不及待地想看到您即将用 Gemini 3 Pro 创造的成果!
53AI,企业落地大模型首选服务商
产品:场景落地咨询+大模型应用平台+行业解决方案
承诺:免费POC验证,效果达标后再合作。零风险落地应用大模型,已交付160+中大型企业
2025-11-19
扣子工作流:AI任务执行的自动化革命
2025-11-19
我们给六个 AI 同一段市场数据,它们生成了六种完全不同的交易策略 | Jinqiu Scan
2025-11-19
Gemini 3 开启智能新纪元
2025-11-19
货拉拉大模型应用开发:功能拓界与业务赋能
2025-11-19
如何利用 Google NotebookLM 实现精准、可溯源的内容生成呢?
2025-11-19
谷歌官宣Gemini 3,团队揭秘模型训练的两个“啊哈时刻”,哈萨比斯:“又向AGI迈进一步”
2025-11-19
Google发布Gemini 3,你想看的都在里面
2025-11-19
Gemini 3 Pro 发布了:这一次,Google 终于端出了一盘“真菜”
2025-08-21
2025-10-02
2025-09-16
2025-09-19
2025-09-08
2025-09-17
2025-09-29
2025-10-26
2025-09-14
2025-10-07
2025-11-19
2025-11-19
2025-11-19
2025-11-18
2025-11-18
2025-11-17
2025-11-15
2025-11-14