免费POC, 零成本试错
AI知识库

53AI知识库

学习大模型的前沿技术与行业应用场景


我要投稿

智能体下半场!腾讯云发布Agent Infra指南

发布日期:2026-01-06 21:46:26 浏览次数: 1582
作者:究模智

微信搜一搜,关注“究模智”

推荐语

腾讯云重磅发布Agent Infra指南,揭秘AI智能体时代的基础设施革命,助你抢占下一代云计算先机。

核心内容:
1. AI Agent从Chatbot到Autonomous Agent的三大演进阶段
2. Agent运行时的核心四要素与爆发式算力需求特征
3. 腾讯云Agent Infra解决方案如何重构云计算架构

杨芳贤
53AI创始人/腾讯云(TVP)最具价值专家

如果你最近密集看到AI Agent、数字员工、Agent Runtime这些词,说明一件事已经很明确了:

AI 的竞争,正在从“模型能力”转向“谁能把 Agent 真正跑起来”。

而真正的分水岭,并不在模型,而在基础设施

腾讯云最近发布的 Agent Infra(智能体基础设施)解决方案,就是一次对云计算形态的前瞻性下注:

Agent 时代,云应该长什么样?(文末附报告下载)

当传统云架构邂逅智能体革命

如果我们回顾云计算的演进,会发现其底层逻辑始终围绕着一个核心命题:如何帮助企业持续解决其IT过程中的“偶然复杂度”(Accidental Complexity),也就是企业为完成其核心业务目标(本质复杂度),因技术、工具或方法选择不当而额外投入的时间与成本。从最早的单体应用到后来的微服务、大数据和AI应用,每一次云的演进,都旨在接管和消除企业面临的特定偶然复杂度。

但AI Agent的出现彻底打破了传统软件的游戏规则。它不再是输入A必输出A'的确定性工具,而是具备不确定性(结果难预测)、复杂性(内部逻辑难拆解)、自主性(自主决策执行)三大特质的全新范式。企业骤然发现,自己需要的不再仅仅是更快的GPU或更大的存储,而是一整套能够理解并承载这种新型数字生命形态的生存环境。

什么是 AI Agent?

很多人会问:Agent应用到底是怎么做出来的?

其实它经历了三个阶段。

第一阶段是Chatbot+RAG:也就是早期的对话机器人。它能回答问题,但不会主动规划。

第二阶段是Workflow Agent:也就是流程型智能体,可以按照预设流程实现自动化任务处理,比如审批、报表、文档整理等,但仍然依赖规则。

第三阶段就是AutonomousAgent:它不依赖固定流程,具备通用能力,能够通过规划、推理和工具调用,自主完成复杂任务。

OpenAI的最新定义指出,一个真正的Agent,由四个要素组成——模型、指令、工具、运行时。模型提供智能,指令定义目标,工具让它能与外界交互,而运行时则是让智能“动起来”的关键。在这里,运行时不再是附属品,而是Agent的核心基石。

Agent的运行特征也与传统应用截然不同。传统的Web服务以可预测的请求-响应模式为主,而Agent的运行方式更像一个持续思考的闭环系统,在执行目标的过程中不断推理、规划、调用工具、自省与迭代。

例如在ReAct模式中,模型需要在每一步推理后决定下一步是“思考”还是“行动”;在思维链模式下,它还会同时模拟多条推理路径,从中筛选出最优解。这意味着一次Agent运行,往往需要成百上千次推理调用、并行计算与中间状态维护。

这类过程也带来了新的计算挑战,即高峰时的脉冲式算力消耗与长尾的空闲周期。换句话说,Agent的运行是一种“爆发-休眠”型负载模式,它在短时间内消耗大量算力,随后又进入静默等待。这对底层算力调度、资源复用与响应延迟,都带来了前所未有的挑战。

Agent Infra需要解决哪些问题?

Agent 的真正难点不是能不能做,而是敢不敢放到生产。

这也是很多团队的真实处境:Demo 很惊艳,但一上线就被安全、成本、运维劝退……

腾讯云把这些总结为Agent Infra 必须解决的五大层面问题:

  • 运维层:Agent 的典型特征是突发调用、即用即销毁、高并发、低持续,要求底层基础设施具备 Serverless 的机制弹性能力。

  • 开发层:为企业级开发者提供构建Agent所需的SDK、框架和开发工具,以简化复杂的编程和集成工作。

  • 工具层:提供核心的工具服务,例如沙箱、网关、数据库等,这些是构建Agent不可或缺的基础组件。

  • 安全层:处理Agent自主性带来的安全风险,例如提供权限隔离、数据劫持、恶意行为防护等机制,确保Agent的行为被严格控制在一个安全的边界内。

  • 智能化层:最高层级的问题是解决如何提升Agent的智能水平 。这包括提供评估体系、数据回放能力以及上下文和长期记忆管理等服务,以支持Agent的持续学习与优化。

这种分层架构的演进模式与云计算从IaaS向PaaS和SaaS发展的历史轨迹异曲同工。在Agent市场发展的早期,构建层(框架、SDK)仍然高度分裂,缺乏统一标准。因此,云厂商从最底层的、最具共性的基础设施需求(运维与安全)入手。

腾讯云Agent lnfra(智能体基础设施)解决方案⸺Agent Runtime

腾讯云Agent Runtime集成 Al运行时(执行引擎)、云沙箱和安全可观测等核心模块,为智能体提供稳定、安全、可弹性伸缩的运行环境。将开发团队从复杂的底层基础设施问题中解放出来,专注于 Agent 本身的创新。

Serverless AI运行时

这是专为Agent原生设计的运行时。它采用乐高式原子化设计,将核心能力拆解为三大模块,让开发者像搭积木一样快速搭建生产级Agent:

  • Agent Server应用:作为智慧大脑,维护对话记忆与任务状态,通过独特的会话亲和调度机制,确保用户与Agent在多轮交互中上下文永不丢失,思绪连贯。

  • MCP Server应用:充当标准化工具箱,以开放协议高效连接模型与外部工具,让Agent的能力扩展如插件般简单灵活。

  • 沙箱应用:提供即取即用的安全容器,预置多种安全沙箱,为代码执行、浏览器操作等高风险任务提供隔离环境,确保风险可控。

云沙箱服务

云沙箱服务为智能体提供多种高度逼真却绝对安全的虚拟执行环境:

  • 代码沙箱:让Agent生成的代码在隔离环境中安全运行,适用于Vibe Coding、数据分析。

  • 浏览器沙箱:提供可交互的网页操作环境,支撑Deep Research、自动化流程。

  • 电脑/移动沙箱:模拟完整的操作系统,实现跨平台的GUI自动化。

沙箱服务的价值在于它允许Agent在其中大胆探索、自由操作,而所有行为都被限定在“楚河汉界”之内,无法越雷池半步,触及企业真实系统。

全链路安全可观测

安全并非单点防御,而是融入血脉的基因。Agent Runtime构建了从身份认证、权限管控、传输加密到全链路日志、行为审计的多维防线。每一则操作皆可追溯,每一次异常实时预警,让智能体的行为全程透明、可控、可信任。

这套架构并非纸上谈兵,它直指企业最痛的三大命门:

1. 安全与自主性的平衡:通过沙箱隔离与会话销毁机制,在赋予Agent强大行动力的同时,为其套上坚实的自律枷锁,解决了企业对于失控的核心恐惧。

2. 成本与弹性的辩证:基于Serverless架构,实现资源毫秒级冷启动、即用即毁。面对突发流量,可支持每分钟十万级实例的并发扩容,让企业无需为峰值囤积资源,只为实际计算付费,将资源利用率提升至极致。

3. 生态与开放的兼容:坚持开放兼容原则,不绑定特定模型或框架,支持容器化自由部署,并兼容MCP等主流协议。这极大降低了企业的迁移成本和锁定风险,让现有技术栈能平滑融入新的智能体生态。

结语

随着AI竞争焦点从模型能力转向基础设施支撑能力,Agent Infra已成为全球云厂商的必争之地。国际巨头中,AWS推出Agent Core聚焦安全与协作,微软Azure主打生态协同,谷歌GCP侧重低代码体验;国内厂商则凭借对本土市场的深刻理解,快速构建差异化竞争力。行业专家表示,Agent Infra仍处于早期阶段,技术是入场券,但生态和场景的深度才是决胜关键。

53AI,企业落地大模型首选服务商

产品:场景落地咨询+大模型应用平台+行业解决方案

承诺:免费POC验证,效果达标后再合作。零风险落地应用大模型,已交付160+中大型企业

联系我们

售前咨询
186 6662 7370
预约演示
185 8882 0121

微信扫码

添加专属顾问

回到顶部

加载中...

扫码咨询