微信扫码
添加专属顾问
我要投稿
智能体技术正从概念走向实际应用,Agent Infra成为推动落地的关键支撑。 核心内容: 1. Agent技术从萌芽到工程化落地的三大标志性实践 2. 大传统与小传统在Agent发展中的张力与融合 3. 中小开发者面临的主要挑战与破局之道
毋庸置疑!2025年title属于「Agent元年」。
要说Agent这把火,一直从年初烧到了年末——
先是Manus,再到最近的豆包手机……Agent已然成为全行业的关注焦点。
而回顾这一年,也是Agent从技术萌芽,走向工程化落地的关键一年。
于是乎,量子位趁热打铁攒了场局,邀请来两位行业大拿——dify开源生态负责人郑立和腾讯云云原生产品副总经理于广游做客,聊一聊他们眼里Agent落地过程中的挑战、机遇和未来:
两位嘉宾还给出了一个高度一致的判断:
在智能体落地过程中,Agent Infra是关键一环。
下面一起跟随量子位的视角,看看他们具体都说了些什么,知识密度之高,不要轻易眨眼。
量子位:那我们今天先从Agent这个概念聊起吧。今年也要结束了,那站在年末,二位对这一年Agent的整体发展有什么印象和总结?
于广游 :我今年对Agent的最主要看法还是,今年Agent已经从技术萌芽期,走到了真正工程性落地的阶段。我个人看到有三种比较标志性的实践:
至于我个人印象比较深刻的应用,其实还是AI代码工具。我觉得一方面它不再只解决代码问题,它也正在成为Agent连接现实世界的通用接口。
第二个点是AI代码工具,切实改变了原先的软件工程范式,然后在我们内部,我们也做了大量的从AI Coding到AISE(AI Software Engineer)的调整,包括研发模式、组织管理、角色职责等。
郑立:其实这一年Agent发展吧,我能感受到就是大传统和小传统之间的鲜明张力。
大传统其实就比如说来自硅谷那些的宏大叙事,他们会许诺用全自动智能体取代白领,逻辑完美但实际落地的时候会有些水土不服。
那从小传统来看,会充满一些烟火气,比如我看到义乌商家使用AI自动回复客户,还有比如独立开发者会用工作流进行代码评审。
总结起来,这是蛮有趣味的一年,然后也是在走向务实。
年初的时候,一个简单的Demo就能吸引资本市场,可以类比“立法阶段”,那年末其实我们就会类似进入到“司法阶段”,开始处理具体的、琐碎的执行层面问题。
这不是线性的进步,更多像是根茎状的蔓延。
那我们也看到秩序的逐步建立,并非来自基座模型的升级,更多时候来自于那些“胶水”——如产品工程、提示词工程、RAG、Pipeline和工具使用等技术手段,虽然它们不够优雅,但确实能够有效地去维持我们数字社会的运转。
量子位:确实就像两位所说,可能年初的时候大家还是会被Demo惊艳,年末就到了更工程化的阶段。其实以我们科技媒体的视角来看,这个进程非常快。智能体为什么会这么快成为行业共识呢?
于广游 :我觉得首先还是它能够真正做到解决问题。过去生产力的发展,本质上都是在延伸人类的手和脚,但实际我们工作中,确实也存在大量无法通过精确语言或编程描述的内容,需要Agent来解决。
然后其次就是,我们在落地过程中对工程方法的探索。今年有一系列工程方法快速成型,包括Agent Infra、Agent Runtime、不同的Agent架构范式、内容工程,这些技术帮助Agent实现了真正落地。
郑立:其实我感觉也差不多,不过在我看来,共识其实是资本在寻求新的组织方式。因为在我看来,互联网时代的红利已经被吃干抹净了,App的边际效用也在递减。
但是Agent承诺的是交互成本的一种坍塌,其实能看到权力从指令式计算到异度式计算的转移。
量子位:其实刚才两位也谈到了,今年有一些关键词都是在变化的,比如可能以前讲AI Infra,现在说Agent Infra。Agent落地与AI落地之间存在哪些区别?以及是否存在工作流的变化和对Infra需求的差异。
郑立:其实我觉得这个范式转移还是很明显的,我们从传统的那种if/else的逻辑判断转向到Agent的概率性目标规划。
放在过去,机器必须执行下一行代码,现在我们开发者更像是老师这种角色,通过Prompt、RAG和原则给予模型自由处理的空间。
区别还是在于新增了很多不确定性,比如传统软件工程中,Bug就是对规则的违反,而放到Agent工程里,失败其实是对我们意图的误解或概率上的漂移。我们没办法再像修Bug一样修复它,而是需要像教育孩子一样去约束或者说服Agent。
这不仅仅是工作流的变化,还有交付物的变化,比如说以前是确定的功能,那现在我们交付的就是一种概率性的能力,你没有办法明确定义它是否正确。
于广游:对,我感觉不确定性非常关键。我们团队内部观察到的是,Agent是不确定性的复杂系统。
那首先,Agent的效果通常是由七八个不同因素构成(模型本身、架构范式、Prompt、Content、工具选择和参数等)。这些子部件彼此之间又相互影响,我们很难明确它们的关系,所以Agent是一个复杂系统。
其次,对于同一个问题,你在不同时刻输入,Agent的输出,它也是不一样的,咱们称之为不确定性。那与之相反的,就是传统的微服务系统。
所以我认为工程师的工作方式必须进行这两点思维转变:
1、从工程思维转向科学实验思维:我们不能再仅仅依赖预先规划,而是要去建立一个评测体系,把里面环环相扣的复杂系统分解为单独的子系统,然后通过控制变量的方式,在科学实验中一步步驾驭Agent。
2、从Day One思维转向Day Two思维:我觉得我们对AI开发的思维也需要转变,过去Day One就代表代码已经上线给用户提供服务,下一步怎么优化看用户的需要;现在Day One只能够代表Agent能运行,效果的持续优化,也就是Day Two才是真正的开始。
所以我觉得Agent落地,不仅仅是靠几个巧妙的范式,我们需要循序渐进通过确定性的工程方法,才能驾驭一个不确定性的复杂系统,而这将带来Infra的重塑。
量子位:于老师刚刚也提到了整个工具的重塑。那从Infra角度来说,能详细讲一下腾讯云为加速Agent落地提供了哪些支持吗?
于广游 :我刚刚说Agent的本质是不确定性的复杂系统,那它在上线过程中,我们首先要解决的最大问题其实是自主运行带来的破坏性风险。
所以我们团队选择从后往前解决。先解决Agent安全问题,我们在Agent Infra上,推出了Agent安全沙箱,给Agent提供了一个独立的执行环境。
然后我们再驾驭Agent的不确定性和复杂性,为此我们会提供一系列的可观测性工具以及评估工具。
再进一步,我们就要进行效果的提升,对Agent的记忆和学习能力进行优化,比如元宝就已经进入了这一阶段。在积累相关经验后,我们也会提供相应的服务。
量子位:那包括您刚刚提到的Agent Runtime、安全沙箱这类Infra产品,和我们这些Agent平台之间有什么关系呢?以及腾讯Infra当前在关注什么?
于广游 :首先我们要厘清一个概念——Agent Infra到底是什么,我们可以先把企业问题划分为本质复杂度和偶然复杂度两种,前者是必须要解决的问题,后者会随着工具和方法选择存在一定的偶然性。
所以我觉得,Infra层其实就是解决企业在问题处理过程中,遇到的偶然复杂问题,但是这个问题是没有定下来的,对于不同的场景,要面临的偶然复杂度完全不同,具体要解决什么问题也要视情况而定。
不过无论解决什么问题,这里都有一个共性问题,这也是我们团队现在做的,就是去构建偶然复杂度问题的最大公共子集,包括:安全、执行环境、工具、记忆和观测。
而这些问题或多或少都有解决方案,其中我们认为最突出的一个问题就是Agent的自主运行。
所以我们团队做的安全沙箱,并不是简单的隔离环境,而是一个多层次、全链路的Agent运行安全体系。
量子位:那郑老师这边,您在提供Agent Runtime这类底层组件时,Dify是更倾向于自研还是说使用第三方产品,以及您对Agent Infra开闭源有什么看法吗?
郑立:我们本身的话,核心模块还是选择自研,我们觉得如果这些使用第三方组件,势必会导致核心组件不可控、给用户的服务质量无法保证,而其它的我们也会选择一些合适的开闭源方案。
然后开源这件事我们是这样认为的,AI时代基础模型可以是黑箱,但Infra必须是白箱,因为开发者需要看到底层代码,想了解Agent行为逻辑。而且我们观察到,对于初创公司和创新者,他们会选择开源,因为这里有一种低成本和灵活性。
相反,那些大企业则更加倾向于选择开源的商业版本或闭源版本,因为闭源实则是给大企业提供了责任转移与兜底服务。
量子位:于老师,根据您这边接触用户的经验来看,他们在选择Agent Infra产品时,一般会比较关注哪些要素?
于广游 :我觉得,首先对核心的业务逻辑层,我看到用户还是在意它是不是开源的,因为这样他们就可以围绕自己的业务进行任意修改,也会更透明更可控。
那具体到Infra层上,用户更在意体验是否极致、能否降低开发成本。在用户使用时,用户就更在意Agent的稳定性和效率,那么在这种情况下,我觉得闭源是有非常好的优势的。
量子位:听二位这样讲下来,我感觉在Agent这个领域里,开闭源正在形成分层互补,那么在这样的结构下,像那种小白开发者或者个人开发者能够通过Agent Infra把Agent开发和落地简化到一个什么程度?
郑立:其实这样我们会逼近于AI开发的一个Excel时刻。
这种简化其实是非常激进的,它会把基础设施的认知负荷降到最低,然后你就可以把全部精力集中在Prompt和数据治理上。
于广游 :我补充一下,我们腾讯云的Infra产品就更偏向于专业开发者,他们会有非常多的复杂度问题需要治理,所以我们主要还是面向Agent原生企业和AI原生企业,去帮助他们加速Agent落地过程。
量子位:想请两位老师来帮我们总结一下,你观察到的Agent Infra技术进展或趋势。
于广游 :我还是前面提到的AI Coding,我对这个事情印象非常深刻。
首先过去一年里,我能看到代码不仅是大模型抽象能力的来源,也正在成为Agent驾驭不确定性、连接世界的工具。
就拿AI Coding来说,它带来的是开发模式的颠覆改变,能够做到让我们团队里的每一个开发者,在分钟级就能拉起一个独立的全套开发环境,所以我觉得代码肯定是会产生全面影响的。
我认为任何一个工程师或者Agent从业者,都绝不能小觑Coding的影响,它非常之重要。
郑立:就我们个人而言,过去一年我们都在做自己的事情,主要的技术进展也都集中在补齐我们的短板。我们也看到了一个比较清晰的趋势,就是技术正在从开发者向非开发者移动。
量子位:如果现在让你们拿三个词限定的话,您能再讲讲Agent Infra为什么说是智能体落地应用的关键环节吗?
郑立:我先说吧,我认为主要是以下三点:
于广游 :我想到的是这三点:
量子位:最后还是来展望一下,刚刚都在聊过去一年,那对于未来的一到两年,甚至三到五年时间里,各位觉得Agent Infra接下来的重点会是哪些方向?
于广游 :对我而言,我们最关注的是Agent Infra如何服务好Agent,能够确保其安全可靠运行。
我其实觉得Agent Infra和AI Infra是交叉的关系,当我们把Agent运行好后,就会发现它的一些不足,然后我们再将产生的数据进行利用,就能对Agent本身和Agent模型进行持续优化。
当前的Infra体系,它更多的是服务于基础大模型本身的能力和智力的进化,而不是业务可用,所以我认为Agent Infra的下一步,一定是从服务好Agent的运行构建到服务好Agent的智能进化。
郑立:我这边会更加关注Agent Infra的可调试性,也就是看清楚是哪一步Agent理解错误,需要去做推理链的可视化调试。
然后就是记忆管理,不仅仅是声音的那种向量搜索,还有就是关注语义化的情景记忆和可计算的时间观吧。我理解中,Agent的记忆不能是简单的常量存储,而应该是一种变量,Agent的目标在执行过程中可能会被重写、降级,所以我们需要对目标进行一些置信度处理。
量子位:好,那感谢两位老师的分享,最后我们来回答几个观众问题吧。第一个问题,从你们的角度看,中小公司和个人开发者他们来做Agent应用最大的门槛是什么?是技术还是成本?
于广游:我感觉这两个都不是,应该是商业模式。
既然是中小公司,那肯定是要赚钱的,但是现在AI Agent还没有到改变整个社会商业模式的程度,这个时候产生的新消费和新的生产力变革还只发生在小领域。
所以如果希望把它应用到你的公司产品中去,我觉得更多的是,创业者需要回到实际问题中解决,同时也可以尝试着把自己的商业模式和形态进行一个巨大的转变。
郑立:我也觉得技术不是问题,你比方说现在大模型智力本身已经过剩了。真正最大的困难,我还是觉得在于企业数据的壁垒和缺乏开始的勇气。
量子位:最后一个观众问题交给于老师,您觉得如果未来Agent成为主流,会对现在的移动开发生态造成什么影响?它们会被彻底颠覆吗?
于广游 :OK,我觉得这个可以要从应用交互形态和开发方式两个角度去讨论。
首先第一个对于形态,我觉得移动端(iOS/Android)形态没有人能给出确切答案。
在Agent的这个形态之外,我们就会立马面临两个问题:
我相信,只有与AI工具为伍、改造研发流程,并用科学实验思维驾驭不确定性的人,才能抓住未来Agent形态转移的机遇。
53AI,企业落地大模型首选服务商
产品:场景落地咨询+大模型应用平台+行业解决方案
承诺:免费POC验证,效果达标后再合作。零风险落地应用大模型,已交付160+中大型企业
2025-12-21
你的知识库为什么总搜不到答案?试试Dify这个“隐藏开关”
2025-12-21
怎样选择Dify工作流中的OCR工具?
2025-12-20
Dify回退版本翻车,你遇到了吗?
2025-12-18
Aiops探索:在n8n工作流里调用Dify应用API
2025-12-17
Dify 从不被看好到 GitHub Top 50 的项目,垄断日本市场,它到底做对了什么
2025-12-17
Dify如何接入本地大模型?
2025-12-17
Aiops探索:这个场景我决定放弃n8n而是选择Dify
2025-12-14
Aiops探索:用Dify做一个基于LLM的ChatOps,从此我们的运维工作变得超级轻松
2025-10-13
2025-12-05
2025-12-08
2025-10-12
2025-11-11
2025-11-09
2025-09-30
2025-11-20
2025-12-05
2025-10-16