支持私有化部署
AI知识库

53AI知识库

学习大模型的前沿技术与行业应用场景


企业构建AI Agent 的五个视角|伯克利Agentic AI Summit

发布日期:2025-08-05 19:43:29 浏览次数: 1520
作者:数字开物

微信搜一搜,关注“数字开物”

推荐语

Google Cloud AI副总裁分享企业构建AI Agent的关键策略,揭示模型性能趋同下的真正护城河。

核心内容:
1. AI Agent的定义与范畴:超越大语言模型能力的任务
2. 企业级AI Agent成功要素:模型选择、工具集成与搜索能力结合
3. 未来趋势:单体Agent与多智能体并存,系统融合成关键瓶颈

杨芳贤
53AI创始人/腾讯云(TVP)最具价值专家


 8月3日,Google Cloud AI 副总裁Burak Gokturk 在伯克利2025 Agentic AI 峰会的 “下一代企业级 Agent”环节进行主题演讲,Burak Gokturk 是 Google Cloud AI 和行业解决方案的总经理和工程副总裁。他回顾了AI 发展历史与驱动力,并分享了企业如何构建自己的 AI Agent。


Burak Gokturk对AI Agent 的定义是:任何无法仅靠大语言模型自身完成的任务,都属于 AI Agent 的范畴。他指出,随着顶尖模型性能的快速趋同,真正的护城河不再是单个模型的能力,而是能够支持模型选择、定制、工具集成、部署和迭代的综合性平台。此外,企业要构建成功的 AI Agent,必须将大语言模型与搜索能力相结合。


Burak Gokturk还认为未来单体 Agent 和多智能体并存, AI 与系统的融合至关重要,与 AI 算法本身的指数级进化相比,系统硬件性能遵循的摩尔定律实际上是“亚线性”的,这反而成为了限制 AI 潜能发挥的瓶颈。


以下是演讲实录,经数字开物编译整理:


Burak Gokturk大家好。我负责 Google Cloud 的研究工作,我们当前的核心是 AI、机器学习、系统科学,以及如何将这三者有效融合。今天我将重点分享一些我们在 AI 领域观察到的关键趋势,并探讨如何将这些趋势与多智能体系统的构建相结合,以及各位在进行自己的设计时可以如何借鉴。


首先,让我们快速回顾一下背景。我想各位都已见证,AI 和机器学习的发展速度一日千里。然而,如果我们回溯历史,审视其根本,会发现当前许多核心算法其实源于上个世纪。这一切都离不开神经网络。它本质上是一组权重和隐藏节点,根据给定的输入来预测输出。同样,其关键的优化算法——反向传播也来自上个世纪。事实上,在 21 世纪初甚至更早,当我们审视这项技术时,神经网络的性能远非顶尖。我们当时都在疑惑,为什么教科书里还要保留它?它的表现确实不尽人意。但我们忽略了几个关键点。首先,神经网络无论是从节点预测(即模型权重的并行化分离)还是从数据并行化的角度,都为在多台机器上进行分布式计算提供了巨大的技术优势。尤其是在训练阶段,你可以在很大程度上并行处理任务。


当然,并行化的优势只有在拥有海量数据时才能得以发挥,因此我们还需要解决数据来源的问题。随后,我想各位都已熟知,研究人员提出了“掩码”的概念。其核心思想是,利用海量的文本、图像等数据,并遮盖其中的一部分。例如,对于句子“伊斯坦布尔是土耳其最大的城市”,你可以遮盖部分词语,然后将这些被遮盖的词语作为训练集的一部分。如此一来,只要利用整个互联网的数据,你就能拥有数万亿级别的训练样本,并结合相应的算法实现训练过程的并行化。就在这时,神经网络的地位发生了戏剧性的转变,从一个并非最优的选择,一跃成为 AI 预测领域无可争议的最佳方案。当然,后来你们也看到了各种里程碑式的论文,比如《Attention Is All You Need》,它所提出的 Transformer 架构,其基础或多或少也是建立在神经网络和反向传播之上。这就是我们如今所处的技术背景。


接下来,我想分享几个我们通过与众多企业交流后洞察到的趋势,并提供一些关于如何在构建自己的 AI Agent 和 Agentic 系统时应用这些洞见的建议。


首先,第一个趋势是,大约两年前,业界关注的焦点是模型的选择,但如今风向已变,平台的选择正变得愈发重要。为什么?我们可以看一个排行榜,当然,业界有很多评估大语言模型在不同任务上表现的排行榜。如果你观察 LMSYS 的聊天模型排行榜,会发现它几乎每周都在更新。每隔几周,就会有一家新公司推出性能卓越的大语言模型。这清晰地表明,我们必须将注意力从单纯的模型转向整个平台。你需要能够接入并使用更广泛的模型。在构建 AI Agent 的过程中,你会反复发现一个核心需求:你需要根据自身的具体用例来调整和适配这些模型。具体来说,这涉及模型的微调和蒸馏。当然,你还需要一个强大的平台,为 AI Agent 在生产环境中的部署提供完备的工具集。这正是 Vertex AI 所提供的价值。在任何一个优秀的平台中,你都应该能看到类似的分层结构。我们有一个叫做“模型花园”的地方,你可以从中访问大量的模型。还有一个“模型构建器”,你可以在这里通过微调和蒸馏来定制化这些模型。最后是“代理构建器”,它提供了一整套工具,帮助你从模型阶段迈向真正的 AI Agent。这涵盖了从任务编排、功能扩展到连接器集成、文档处理等方方面面。


第二个趋势是搜索。我们从大量企业的实践中发现,要构建成功的 AI Agent,必须将大语言模型与搜索能力相结合。原因显而易见。首先,大语言模型的知识是基于过去的训练数据,因此它们无法知晓昨晚的球赛结果。其次,它们会产生“幻觉”,这其实也是其创造力的一种体现,但也意味着它们在陈述事实时可能并不完全准确。最后,它们无法提供信息的来源引用,而对于许多应用场景来说,追溯数据来源至关重要。因此,我想让大家记住的关键一点是:在你的多数应用中,都必须集成搜索功能。


接下来是第三个趋势,很显然Agent 的时代已经到来。大语言模型本身并不能完成所有任务。你需要将它与不同的工具集相结合,甚至可能需要在你的 AI Agent 中调用多个大语言模型。回顾早期的应用,主要是对话和摘要——这些都是大语言模型可以独立完成的。但现在情况不同了。我对 AI Agent 的定义是:任何无法仅靠大语言模型自身完成的任务,都属于 AI Agent 的范畴。这意味着,AI Agent 需要调用不同的工具,执行函数调用,并能将所有这些能力整合起来。同样,拥有一个配备了强大工具集的优秀平台,对于构建你的应用而言,将是成功的关键。这里有几个关键属性。我认为函数调用是尤其需要强调的一点,当然,用于个性化的内存管理也同样重要。但函数调用对于许多大语言模型而言仍是一项挑战,因为它们首先需要判断是否需要通过调用函数来回答问题,其次还需要调用正确的函数。这很有挑战性。从排行榜的数据来看,如果给模型提供 100 个函数供其选择,它选择正确函数的准确率大约在 50% 到 70% 的水平。所以请记住这一点:在构建 AI Agent 时,请从简单入手,不要一上来就尝试构建一个需要从 100 个不同函数中进行选择的复杂应用。


现在,请允许我谈谈下一个趋势未来你会看到单体Agent 和多智能体并存。我想举一个多智能体的例子。这是我们最近发表的一篇名为《Co-Scientists》的论文,它本质上是一个用于医学发现的系统。想象一下,你是一位医学研究员或医生,你有一个研究助理,你让他去进行一项研究。这个系统会去阅读所有相关的论文,不仅包括正在研究的疾病,还包括相关领域的疾病。它会进行全面的文献综述,进行自我评估,还会执行伦理审查等等。所有这些功能共同构成了一个多智能体系统,其中每一个功能模块都是一个独立的 Agent。接下来,我们来播放一段视频。


Interviewer: ...系统在两天内就给出了答案,而这个答案您花了将近十年才找到。您当时的反应是怎样的?


Dr. Jose Penades: 我的反应是……当时我正和别人一起购物,那是个周六下午。我对同伴说:“请让我一个人待一个小时,我需要消化一下这件事。” 我当时非常震惊。然后,我做的第一件事就是给 Google 写了封邮件,问道:“你们是不是访问了我的电脑?对吧?”因为不然……


Interviewer: 您以为他们在作弊。


Dr. Jose Penades: 绝对是。而且,我有时候也会用 ChatGPT 之类的工具来润色我的英文。我想,你们肯定是接入了这些,不然没法解释。但他们回复说:“不,这就是我们系统给出的最佳结果。” 这不仅仅是因为它提供的首要假设是正确的,更在于它还额外提供了四个假设,而且每一个都言之有理。其中甚至有一个是我们从未考虑过的方向,我们现在正基于此开展新的研究。


这位是 Dr. Jose Penades。他的团队在过去 15 年里,一直在用一种特定的方法研究各种疾病。而我们的系统,仅仅用了一天左右的时间,就得出了类似的结论,甚至在某些方面做得更好。再举一个例子,有位遗传学领域的专家,他在 X 上大概有超过一百万的粉丝。我们向他演示了这个系统。他本人曾利用遗传学方法治愈了一些疾病,但这花了他将近 20 年的时间。他看完演示后说:“在见识了今天的 AI 模型之后,我可以自信地断言,科学研究的范式将被彻底改变。” 他甚至 99% 地确信,包括癌症在内的所有疾病,都将在未来十年内被攻克。这些是我们收到的真实反馈。这虽然只是一个来自医学领域的例子,但它向我们揭示了一点:AI 真的在推动我们突破想象的边界。这些系统所能完成的工作,可能需要一个人用一百辈子的时间。我们将在各种方法和多智能体系统中,见证越来越多这样的成果。所以,我们必须为此做好准备。


最后,作为总结,我想谈谈最后一点:我们正在大力投入 AI 与系统的融合,这一点也至关重要。这或许听起来是次要的,但系统实际上是当前的一大瓶颈。系统硬件的性能提升遵循着摩尔定律,我们曾以为那是指数级增长,但与AI 算法的进化速度相比,它实际上是亚线性的。因此,你会看到 AI 与系统在几乎所有领域加速融合,这是因为底层系统必须跟上步伐,才能真正满足 AI 带来的庞大需求。


| 文章来源:数字开物

• END• 

【专栏】精品再读

大模型最大的落地场景出现了|2024数字开物大会成功举办
AI与数据中心出海东南亚面临两大挑战|万字圆桌实录
2万字完整演讲实录:最强TPU芯片、全新AI Agent 来了|谷歌云 Next 大会
黄仁勋3万字完整精校实录:"思考型token"爆发,AI infra即将巨变
何宝宏:大语言模型上半场已进入“垃圾时间”
深度|“唤醒”特斯拉,进击的中国Robotaxi

53AI,企业落地大模型首选服务商

产品:场景落地咨询+大模型应用平台+行业解决方案

承诺:免费POC验证,效果达标后再合作。零风险落地应用大模型,已交付160+中大型企业

联系我们

售前咨询
186 6662 7370
预约演示
185 8882 0121

微信扫码

添加专属顾问

回到顶部

加载中...

扫码咨询