支持私有化部署
AI知识库

53AI知识库

学习大模型的前沿技术与行业应用场景


企业级 AI 的未来:IBM 实现通用型企业级 AI 智能体的重大突破

发布日期:2025-07-22 06:50:40 浏览次数: 1556
作者:IBM中国

微信搜一搜,关注“IBM中国”

推荐语

IBM在通用型企业级AI智能体领域取得重大突破,CUGA智能体已能像资深员工一样处理复杂业务场景。

核心内容:
1. IBM CUGA智能体的核心能力与行业突破
2. 技术架构演进与多智能体协作机制
3. 企业级AI从实验室走向实际应用的未来展望

杨芳贤
53AI创始人/腾讯云(TVP)最具价值专家



在 AI 发展日新月异的今天,AI 智能体无疑正处在技术前沿。近日,IBM 发布了通用型企业级 AI 智能体(IBM Computer Using Generalist Agent,此后简称 IBM CUGA)的重要突破,引发业界广泛关注。继 Think 2025 大会上发布 AI 智能体平台 watsonx Orchestrate 后,IBM 研究院在企业级智能体领域再次迈出了实质性的一大步。




如今,IBM CUGA 不仅在模拟企业场景中经受住了严苛测试,更在最新(2025年 7月)的 AppWorld Benchmark 中荣登第一(注:AppWorld Benchmark 是一个由多个研究机构和学者共同创建、用于评估交互式编程智能体的基准测试环境)。在不久的未来,我们或许能看到 AI 智能体逐步从“实验室玩具”迈向“企业核心助手”。



通用型企业级 AI 智能体是什么?为何重要?

传统 AI 智能体在企业应用中多是“单一功能专家”——比如处理发票、生成邮件、跟踪销售进度等。这些功能虽然实用,但面对跨流程、跨系统、跨业务的复杂场景时,往往会显得力不从心。


IBM CUGA 正是为复杂业务场景而生。它是一种能够跨多个业务场景、整合多种工具、执行复杂任务的通用型智能体,可以像资深员工一样理解用户意图、规划任务、调用工具、协调多个系统,并不断学习和适应新的挑战。



荣耀背后,是技术进阶和厚积薄发

IBM CUGA 的出现并不是一蹴而就的,它是架构进化、方法创新和工具集成的系统性成果:


  • 架构演进:从最初简单的“计划-执行-观察”模型(完成率 15%),进化到如今能协调多个子智能体、感知网页环境、处理复杂任务的多层级系统,任务完成率提升到 61.7% 甚至更高[1]


  • 工具赋能:

  • 实时性能仪表盘,掌握每一个智能体动作的效果;

  • 轨迹可视化工具,直观诊断失败原因;

  • 并行执行框架,将评估速度从数天压缩到数分钟。



  • 多智能体协作:一个任务由多个“子任务智能体”协同完成。比如,规划、执行、信息提取各司其职,让智能体能像团队一样作战。


  • 环境感知增强:结合网页截图和可访问性树,智能体看得更清、操作更准,还能识别弹窗等障碍进行规避。


安全、可信、可控的智能体平台,打造适配业务需求的 AI 智能体

IBM 不仅关注智能体的“聪明程度”,更重视它的“企业适配能力”。借助最新发布的企业级 AI 智能体平台 watsonx Orchestrate,客户有望实现:


  • 全生命周期可观测性,兼顾性能监控、模型优化、安全防护;


  • 无代码与专业工具并存,既支持业务人员快速部署,也支持开发者深度定制;


  • 兼容超过 80种企业级系统,与 Adobe、SAP、Salesforce、ServiceNow 等生态无缝集成;


  • 治理与合规,为隐私、安全、成本可控提供保障,帮助企业实现 AI 治理与合规。



真正的“企业AI助手” 正在加速来到

除了在 AppWorld 基准测试夺魁,IBM CUGA 还在 WebArena 等真实浏览器任务中展现强大能力。通过“智能采样”、“反馈反射”、“知识注入”等一系列创新方法,CUGA 每一次迭代都更接近企业级实用标准




IBM CUGA 不是实验室的“炫技”,而是指向未来企业运营方式的变革。在准确率达到更高门槛后,CUGA 有望成为企业内部的通用调度平台 —— 不再是被动响应用户指令,而是主动协助完成复杂的工作任务,例如跨系统的数据整合、文档生成、流程管理等。


53AI,企业落地大模型首选服务商

产品:场景落地咨询+大模型应用平台+行业解决方案

承诺:免费场景POC验证,效果验证后签署服务协议。零风险落地应用大模型,已交付160+中大型企业

联系我们

售前咨询
186 6662 7370
预约演示
185 8882 0121

微信扫码

添加专属顾问

回到顶部

加载中...

扫码咨询