微信扫码
添加专属顾问
我要投稿
Gemini 3的惊艳表现背后,是谷歌十多年前对DeepMind的前瞻性收购和长期投入,这才是其AI逆袭的真正原因。核心内容: 1. DeepMind的创立背景与"解决智能"的宏伟使命 2. 谷歌收购DeepMind的战略意义与长期价值 3. DeepMind技术如何转化为谷歌产品栈的核心竞争力
让我们把时间倒回到 2013 年。DeepMind 是一个位于伦敦的古怪小公司,由 Demis Hassabis、Shane Legg 和 Mustafa Suleyman 创立。Hassabis 曾是国际象棋神童和游戏设计师,后来重返神经科学领域进行严谨研究。公司的既定使命有着近乎荒谬的雄心:首先“解决智能”(solve intelligence),然后用它来解决其他一切问题。
当大多数初创公司都在推销应用程序和增长曲线时,DeepMind 正在用《突破》、《乒乓》和《太空侵略者》等雅达利游戏训练神经网络。这些模型只看到像素和分数,没有任何规则概念,也没有手工设计的特征。随着时间的推移,它们仅仅通过试错就从一无所知发展到了超人水平。
在硅谷,这被视为一种好奇:很酷的演示、奇怪的英国人、关于“通用智能”的豪言壮语。但在大型科技公司内部,人们注意到了。这就是 Facebook 和谷歌都围绕这家公司进行竞争的原因。
到 2014 年初,事情变得真实。多家媒体报道,谷歌以超过 5 亿美元的价格击败了 Facebook 收购 DeepMind,这在当时对于一家没有消费产品的公司来说,感觉是异乎寻常的。The Information 等媒体还报道了这次收购的一个不同寻常的条款:作为交易的一部分,谷歌同意设立一个 AI 伦理委员会,以确保该技术得到控制。
除非你相信你的工作可能真的在文明层面产生影响,否则你不会推动建立这种结构。而除非买家相信你拥有别人没有的东西,否则你也无法得到它。
事后看来,那就是谷歌悄然买下自己未来的时刻。只不过,它花费了近十年时间、一名韩国围棋冠军、一项蛋白质折叠的突破、数十亿美元的 TPU 集群,以及 ChatGPT 带来的震撼,才让这一点变得显而易见。
DeepMind 在加入谷歌之前的历史之所以重要,是因为它解释了至今仍在主导谷歌许多 AI 策略的文化。它从来都不是一家普通的产品初创公司。
Hassabis 和他的联合创始人来自学术实验室,那里的人们以十年为单位思考,而不是季度。他们从计算神经科学和强化学习中汲取思想,试图构建能够学会掌握许多任务的系统,而不仅仅是一个狭窄的基准。游戏只是试验场,而不是目标。
因此,他们没有发布社交应用或广告技术产品,而是不断发表论文。他们展示了深度强化学习智能体可以使用单一架构,仅从原始像素输入,就能在雅达利游戏套件上达到或超越人类的强大表现。这听起来枯燥,但这是单一学习系统可能扩展到处理许多任务的第一次真正展示。
在谷歌内部,这种思维方式落地在了一片非常肥沃的土壤上。谷歌已经对机器学习的定制芯片(TPU)进行了大量押注,拥有来自搜索、YouTube 和 Android 的海量数据流,并且拥有世界级的 AI 团队 Google Brain。DeepMind 带来了一种不同的、近乎苦行僧般的固执能量:工作的核心是智能本身的进步。
这种固执是他们最终选择谷歌而非 Facebook 的部分原因。多年后,马克·扎克伯格(Mark Zuckerberg)本人也承认,Hassabis 利用 Facebook 的兴趣作为筹码,与谷歌谈判达成了一项更好的协议。这不仅仅是定价博弈,而是一位创始人试图选择一个能够让他的研究议程得以生存的环境。
如果你和技术人员谈论 DeepMind,他们的眼睛首先会因为 AlphaGo 而发光。
2016 年,AlphaGo 在首尔以 4 比 1 的比分击败了李世石(Lee Sedol),后者是当时最强的围棋选手之一。全世界都目睹了一台机器下出了被顶级职业选手称为既优美又陌生的棋步。
那是一场电视盛事,但它也是一场产品战略盛事,即使表面上看起来不像。
AlphaGo,随后的 AlphaZero,以及在《星际争霸 II》中的 AlphaStar,都推行了相同的核心思想:采用强大的通用模型,先用人类数据进行训练以起步,然后通过自我对弈使其变得更加强大。构建不仅能记忆模式,还能规划、探索和发明策略的智能体。AlphaStar 后来在混乱、实时、信息不完美的《星际争霸 II》天梯上达到了宗师级水平,这意义重大。
在谷歌内部,这成为了一种指引方向的北极星。它表明学习系统可以在那些看起来混乱、需要战术的领域(而不仅仅是学术领域)发现人类错失的策略。如果你仔细观察,这开始看起来非常像谷歌真正在乎的问题:如何更有效地运行数据中心、如何在全球网络中调度资源、如何在平衡参与度和安全性的情况下推荐内容。
这些游戏系统也塑造了公司的内部信心。在公众看来,世界仍然将谷歌视为一个搜索框和广告机器。但在内部,工程师们看到一个伦敦的团队悄悄地攻克了一个又一个在十年前感觉像是科幻小说的挑战。
这把我们带到了最终让世界其他地区开始关注的突破。
2020 年底,DeepMind 宣布 AlphaFold 在预测蛋白质三维结构方面达到了一个准确度水平,许多生物学家曾认为这需要数十年的时间才能实现。它有效地解决了生物学中一个持续了五十年的核心开放问题:给定氨基酸序列,折叠后的蛋白质是什么样子。
在接下来的几年里,DeepMind 及其合作伙伴发布了数亿种蛋白质的预测结构,涵盖了科学界已知的大部分蛋白质,并将其免费提供给公共数据库。这不仅仅是锦上添花。它改变了整个药物发现和基础生物学领域的起点条件。团队不再需要等待数月或数年进行实验结构工作,而可以在第一天就从高质量的预测开始。
2024 年,Hassabis 和 John Jumper 因 AlphaFold 背后的工作获得了诺贝尔化学奖。一个 AI 实验室的领导者,在生物学实验领域赢得诺贝尔奖。这不是投资者在 2014 年会去建模的事情,但这正是 DeepMind 计划要做的那种事。
谷歌总共培养了5位诺贝尔奖得主
随后,Alphabet 剥离了一家独立公司 Isomorphic Labs,以这些工具为基础,建立一个商业药物发现业务,与主要的制药合作伙伴合作,其使命是彻底加速从概念到临床试验的路径。
如果你想理解谷歌的 AI 战略,这就是转折点。谷歌现在有了证据,证明其核心 AI 研究小组可以做到三件很少能集中在一处的事情:
它可以在开放基准和科学挑战中产生最先进的成果。
它可以将这些成果转化为其他科学家和公司实际使用的平台。
它能以一种提升公司声誉的方式做到这一点,让公司不仅仅是一个搜索和广告垄断者。
你可以整天争论商业模式,但这是吸引世界级人才的东西。
快进到 2023 年。此时,谷歌拥有两大 AI 引擎:在谷歌内部由 Jeff Dean 早期工作发展而来的 Google Brain,以及位于伦敦的 DeepMind。两者都拥有深厚的才华、重大的贡献和各自的文化。
与此同时,OpenAI 刚刚凭借 ChatGPT 在整个行业点燃了一把火。一夜之间,“聊天机器人”从新奇事物变成了默认的界面。谷歌看起来反应迟钝。公司匆忙推出了 Bard(最初基于 LaMDA,后来基于 PaLM 2),但整个过程给人的感觉是被动应对。
因此,Sundar Pichai 做了一件重要的事情。他宣布将 Brain 和 DeepMind 合并为一个名为 Google DeepMind 的单一部门,并由 Hassabis 领导。
仔细阅读他们的公开描述,你可以看到这种转变。他们谈到将世界两大领先的 AI 实验室整合到一个专注的团队中,以谷歌的计算资源为后盾,并肩负着推动研究和产品的双重使命。
自那次合并以来,你可以在谷歌的模型系列中看到这个统一团队的印记。Gemini(取代 PaLM 2 的多模态语言模型家族)被公开描述为一项由 DeepMind 牵头、整合了 Brain 的基础设施和谷歌产品团队的努力。Gemini 在 2023 年底推出了三种版本,从用于设备上的 Nano 到用于重量级推理的 Ultra。
随后是迭代浪潮。Gemini 2.0 具有更强大的多模态能力以及更好的图像和音频支持。Gemini 2.5 是一个专注于推理的模型,它会在回答之前进行“暂停思考”,并开始出现在 Google Search、Workspace 和 Android 等各个地方。与此同时,还有 Gemma,这个开源模型家族为开发者提供了结构相似、但更小、训练有素的模型,以及用于视觉和药物发现等科学工作的专业版本。
这不再是躲在角落里的研究实验室。它是谷歌目前正在交付的几乎所有“AI”背后的核心引擎。
而且这不仅仅局限于语言。DeepMind 还负责 AlphaDev,它找到了更快的排序和哈希算法,这些算法最终被纳入了 C++ 标准库和广泛使用的开源代码中。每一个单独的改进都很微小,但当你在全球工作负载中运行这些函数数十亿次时,收益就变得巨大。
他们构建了 RoboCat,这是一个用于控制机械臂的模型,可以适应新的硬件和任务;最近,又推出了 Gemini Robotics 模型,推动机器人从模拟、现实世界数据和语言指令的混合中学习。
2025 年,他们推出了 AlphaEvolve,这是一个使用大型模型来搜索更优算法的进化式编码系统。据报道,在谷歌自己的技术栈中,这个系统恢复了接近百分之一的全球计算能力,并在困难的数学和优化问题上击败了最先进的方法。
这里有一个模式:在合成任务上学习,利用自我对弈和搜索变得更强大,然后将这些技术带回到工程、基础设施和科学的复杂世界中。
如果你关注公开采访,Demis Hassabis 一直在坦率地表达他的想法。多年来,他始终如一地表示,DeepMind 的真正目标是人工通用智能 (AGI),大致在五到十年的时间范围内实现;而目前缺失的主要部分是更好的推理、规划、记忆和一致性。
他还直言不讳地指出当前系统的不足。他谈到他所谓的“锯齿状智能”。Gemini 及其同类产品可能在一个瞬间解决奥林匹克级别的数学问题,而在下一个瞬间却在一个高中代数问题上绊倒。它们有一天能写出出色的代码,第二天却会编造出微不足道的 API 细节。正是这种不平衡性,被他视为 AGI 的主要障碍。
据多数报道称,在公司内部,他经常反对该技术的短期、纯商业用途。据称,他放弃了一些利润丰厚的机会,转而专注于 AlphaFold、药物发现和构建通用 AI 助手等方面。重点在于深刻的问题,而不仅仅是快速变现。
这种方法有利有弊。Alphabet 向这项工作投入了巨额资金,而 DeepMind 的直接收入在历史上与 Google Cloud 或 Search 相比显得不温不火。一些投资者和高管都在催促DeepMind更快的商业化。
但关键在于:当谷歌需要回应 ChatGPT 时,它不必重新组建一个新的 AI 实验室。它已经拥有一个训练前沿模型长达十年的团队,拥有在规模上运行它们的经验,并且证明了它可以交付科学成果,而不仅仅是演示。
这才是现在的优势。不是某一个 Gemini 版本的发布,而是一个长期生活在技术前沿,并且现在直接接入谷歌产品栈的组织。
如果你只看表面指标,你可以讲述一个关于谷歌 AI 地位更乏味的故事。你可以指出它的数据规模、Android、Chrome 和 YouTube 的覆盖范围、它的定制 TPU 硬件和它庞大的销售引擎。所有这些都很重要。
但每家主要的科技公司都拥有这些资产的某种版本。微软拥有 Azure 和 Office。Meta 拥有 Instagram 和 WhatsApp。苹果拥有 iOS 和设备基础。亚马逊拥有 AWS 和零售。这些都无法真正解释为什么,在看起来起步缓慢之后,谷歌现在又拥有了市场上最强大的模型系列之一。
区别在于,谷歌购买并保护了一个坚持将 AI 视为一场长期游戏的实验室。
DeepMind 在出售自己时推动建立了伦理委员会。即使在 Alphabet 内部,它也保留了自己的文化和领导层,并且在时机成熟时,它吸收了谷歌的另一个大型 AI 实验室,而不是反过来。
它在截然不同的社区中建立了信誉。围棋选手和游戏玩家看到了 AlphaGo 和 AlphaStar。生物学家看到了 AlphaFold 和蛋白质结构数据库。开发者看到了 AlphaDev 出现在 C++ 标准库中。数据中心工程师看到了 AlphaEvolve 恢复了真实的计算容量。
而现在,消费者在他们的搜索结果和 Workspace 工具中看到了 Gemini,而开发者看到了 Gemma 和其他开源技术栈。研究和产品之间的桥梁,正是 Google DeepMind。
在 Hassabis 谈论未来时,你也能感受到这一点。他声称 AI 可能会比工业革命更大、更快,但同时又主张更多的谨慎、更好的评估和严格的安全措施。这种雄心和不安的结合,正是你希望掌舵你的前沿模型战略的人所具备的特质。
谷歌的竞争“赢了”吗?还差得远。OpenAI 仍在努力推进。Anthropic、Meta 和其他公司都是非常现实的竞争对手。几乎肯定还会有来自我们尚未密切关注的领域的惊喜。
但是,当我审视谁拥有研究血统、基础设施以及将模型推向数十亿用户能力的最佳组合时,很难不认为谷歌在 2025 年末比 2022 年末处于更强大的地位。而这种转变的最大单一原因,不是某个特定的 Gemini 版本或病毒式营销活动。
这是一个十一年前的决定:收购一个对下围棋和预测蛋白质形状更感兴趣、而不是忙着构建另一个社交应用的古怪伦敦小实验室。
DeepMind 在谷歌内部的影响不仅仅是代码和论文。它是一种关于什么才算进步的心态。
他们没有痴迷于月活跃用户或季度收入目标,而是追踪那些乍一看几乎是抽象的基准的进展。围棋排名、蛋白质折叠竞赛、内部数学和推理测试。他们关注的是 Gemini 在简单任务上有多一致,而不仅仅是演示在舞台上看起来有多好。
这种文化会蔓延。当你把这种文化放在像谷歌这样的公司的中心时,你就会改变内部其他人对“获胜”的定义。产品团队开始问的不仅仅是能否围绕模型设计一个界面,而是模型本身是否足够可靠值得信任。基础设施团队开始为需要暂停和思考的模型进行规划,而不仅仅是流式传输 tokens。
我在这里并非天真。谷歌仍然是一家庞大的上市公司,面临着所有常见的压力。有很多发布让人感觉仓促,有很多地方是业务需求在明显地指挥研究。
但如果你放眼全局,这条轨迹是清晰的:谷歌支持 DeepMind,然后让它负责其前沿模型的决定,是该公司仍然拥有可信的 AI 领导地位主张的最重要原因。不是唯一的原因,但却是最重要的一个。
如果我们将时间快进十年,发现我们在讨论哪个组织最终跨越了推理、规划和发现能力达到人类水平的界限,我有一种感觉,我们将讲述一个从同一个地方开始的故事。
一个在伦敦的初创公司,在玩电子游戏并谈论“解决智能”,而当时的行业其他公司仍在忙着开发应用程序。
原文链接:https://www.smithstephen.com/p/googles-secret-weapon-isnt-gemini?utm_source=%2Finbox&utm_medium=reader2
53AI,企业落地大模型首选服务商
产品:场景落地咨询+大模型应用平台+行业解决方案
承诺:免费POC验证,效果达标后再合作。零风险落地应用大模型,已交付160+中大型企业
2025-11-20
找到了!企业内部顶级销售专家 AI 智能体,一键让你 get 企业级的销售指导服务「附提示词」
2025-11-20
和快手聊了之后才知道,传统搜索早变天了
2025-11-20
OpenAI发布GPT-5.1 Codex Max,编程能力比Gemini 3更强、更持久
2025-11-20
OpenAI紧急发布GPT-5.1-Codex-Max,带来「长程任务能力」,可24小时工作
2025-11-20
OpenAI深夜双王炸!GPT-5.1 Pro紧急发布,降维打击Gemini 3
2025-11-20
生成式引擎 GEO 白皮书:AI 流量时代的机遇与挑战行业深度观察
2025-11-20
IBM 发布 Granite-Docling-258M:企业级文档 AI 的结构化进阶
2025-11-20
Gemini 3.0发布,但Generative UI更让我眼前一亮
2025-10-02
2025-09-16
2025-09-19
2025-09-08
2025-09-17
2025-09-29
2025-10-26
2025-09-14
2025-10-07
2025-09-30
2025-11-19
2025-11-19
2025-11-19
2025-11-18
2025-11-18
2025-11-17
2025-11-15
2025-11-14