免费POC, 零成本试错
AI知识库

53AI知识库

学习大模型的前沿技术与行业应用场景


深度|Salesforce 2025:企业级 AI Agent 如何从演示走向真实

发布日期:2025-10-22 12:14:49 浏览次数: 1586
作者:锤子在找钉

微信搜一搜,关注“锤子在找钉”

推荐语

Salesforce 2025年突破性进展:AI Agent如何解决企业级应用中的"智能体鸿沟"问题,实现从演示到真实落地的跨越。

核心内容:
1. 消费级AI与企业级AI体验的断层现象及成因分析
2. Salesforce提出的"上下文工程"解决方案框架
3. AgentForce平台如何嵌入全业务流实现AI落地

杨芳贤
53AI创始人/腾讯云(TVP)最具价值专家
过去 26 年里,Salesforce 有 20 到 100 万次客户联系请求没有得到回应。不是不想回,而是人手不够。这个数字养肥了竞争对手,也成为企业服务行业的隐痛。
但就在 2025 年 10 月的 Dreamforce 大会上,CEO Marc Benioff 宣布:仅上周,他们的 AI SDR 就回拨了 5 万个客户电话。这个转变的背后,是一场从“消费级 AI 体验”到“企业级 AI 落地”的跨越。
回顾 2024 年 Benioff的演讲:Agentforce" data-itemshowtype="0" linktype="text" data-linktype="2">Salesforce 创始人 Benioff: 从 Oracle 到云端 SaaS 帝国,再到 Agentforce
这篇文章核心讨论的问题:
  • 为什么消费端 AI 体验如此流畅,企业端却难以复制?
  • Salesforce 如何通过 AgentForce 平台跨越这道“代理鸿沟”?


本文基于 Salesforce 2025 年 Dreamforce 主题演讲实录。演讲者包括 Salesforce CEO Marc Benioff、OpenAI COO Brad Lightcap、产品负责人 Patrick Stokes 及多位业务线负责人。

Salesforce 是全球最大的 CRM 平台提供商,2025 财年收入达 400 亿美元,拥有 2100 万开发者用户。此次大会首次系统展示了其“Agentic Enterprise”(agent化企业)战略全貌。


       
消费端与企业端的 AI 体验断层
01
Benioff 在开场就抛出一个所有人都有感触的现象:
在家用手机与 ChatGPT 对话时体验流畅,但回到办公室打开企业系统,AI 能力却大打折扣。
Benioff 称之为"Agentic Divide(智能体鸿沟)"
消费级 AI 已经跨过易用性门槛,企业级 AI 却卡在数据孤岛、治理缺失、上下文缺失的泥潭里。
“你的数据不对,AI 就不对”——Benioff 用这句话点出企业 AI 落地的第一性问题。
MIT NANDA项目《State of AI in Business 2025》报告追踪300家企业实施案例,发现95%的 AI 试点项目未产生可衡量的财务回报,核心症结是企业缺失的三层关键能力:
深度数据集成、业务上下文理解、以及人机协同的治理框架
(https://fortune.com/2025/08/18/mit-report-95-percent-generative-ai-pilots-at-companies-failing-cfo/)。
Salesforce 将这三者统称为“上下文工程”(Context Engineering),并认为这是区别于消费级 AI 的核心壁垒。
这直接影响了 AgentForce 的产品设计。
它不是一个独立的聊天机器人,而是一个嵌入 Salesforce 全业务流的agent层——销售、服务、营销、IT、HR、供应链,每个模块都有对应的 AI agent,且这些agent能访问统一的客户数据平台(Customer 360)。
当客服agent回答客户问题时,它能看到这个客户的历史订单、服务记录、营销触点,而不是从零开始对话。
从技术架构看,Salesforce 做了两个关键取舍:
一是放弃"一个通用模型解决所有问题"的路径,转而为不同行业和职能定制超过 300 个专用agent;
二是在agent层之上构建"全渠道监督器"(Omni-Channel Supervisor),实时监控 AI agent与人工客服的协作质量。
这套设计的底层逻辑是:AI 不会完美,但人机协同可以逼近可靠。
Human in the loop——在AI自动化流程中保留人类参与和监督的环节

       
从零到 160 万次对话:Salesforce 如何成为"Customer Zero"
02
Salesforce 选择将自己作为“客户零号”(Customer Zero)。
从 2024 年 10 月 AgentForce 发布至 2025 年 7 月,他们在自家客服系统(http://help.salesforce.com) 上累计完成 160 万次 AI 驱动的客户对话。
这个数字是真实业务流量——每一次对话都关联到工单系统、知识库和客户满意度评分。
“我们不是完美地推出产品,而是在倾听、迭代、演进”——Benioff 承认初期并不顺利,但强调快速反馈循环的价值。

这 160 万次对话暴露出三个关键问题。

第一,AI agent在处理结构化查询(如账单金额、订单状态)时准确率超过 90%,但遇到需要多轮推理的复杂问题(如"为什么我的集成失败了")时,仍需人工介入。


第二,客户对 AI 的容忍度与场景强相关:在自助查询场景下,客户接受 AI 先行;但在投诉或退款场景,客户更希望直接对接人工。


第三,AI 的“幻觉”问题在企业场景下后果更严重——一个错误的产品推荐可能导致合规风险或客户流失。

针对这些问题,Salesforce 在 AgentForce 360 平台中引入了三项机制:
  • "AgentScript",允许开发者用代码显式定义agent行为的关键路径,而非完全依赖模型自主决策。这类似于在自动驾驶中设置"必须刹车"的硬约束。

  • “智能上下文”(Intelligent Context),通过 Tableau 语义模型让 AI 理解业务数据的关系网络,而不仅仅是表面文本。

  • "语音agent"(AgentForce Voice),将 AI 能力扩展到电话客服这一最高频渠道。


       
从提示词工程到上下文工程
03
AgentForce 的核心差异化不在模型本身,而在“上下文工程”。
Benioff 反复强调一个观点:大语言模型只是原材料,真正的价值在于如何将企业的数据、流程、规则注入模型的推理过程。
这需要三层能力的叠加。
第一层是数据语义化。
Salesforce 通过 Tableau 的语义模型,将散落在不同系统中的客户数据、产品数据、交易数据转化为 AI 可理解的关系图谱。
例如,当客户询问“我的订单什么时候到”,AI 不仅要查订单表,还要关联物流表、库存表、客户历史投诉记录,才能给出可信答案。
这套语义层在演示中被称为“业务语言”(Language of Business),它让 AI 不再是“看字面意思猜答案”,而是“理解业务逻辑后推理”。
“我们的 AI 不仅会说人类语言,还会说业务语言”——产品负责人 Patrick Stokes 在演示 AgentForce Vibes 时如此解释。

第二层是流程可编排性。
AgentForce 允许企业定义"agent动作库"(Agent Actions),即 AI 可以调用的标准化业务操作,如创建工单、发送邮件、更新 CRM 记录。
这些动作既可以由 AI 自主触发,也可以在关键节点要求人工审批。
例如,客服agent可以自动处理退货请求,但超过 500 美元的退款必须转人工。这种"护栏"机制让 AI 在自主性与可控性之间取得平衡。

第三层是多agent协同。
在 Dreamforce 演示中,一个 Dreamforce 指挥中心应用同时调用了数据分析agent、地图可视化agent、流程自动化agent。
这些agent通过 MCP(Model Context Protocol)服务器通信,共享上下文状态.
这意味着企业可以构建"agent网络",而不是孤立的单点工具。
这套架构的技术实现依赖 Salesforce 的 Data Cloud 和 MuleSoft 集成平台.
前者提供统一的客户数据视图,后者负责连接企业内外部系统。
值得注意的是,Salesforce 并不强制客户使用特定大模型——AgentForce 360 支持 OpenAI、Anthropic、Google 等多家模型,甚至允许企业接入自训练模型.
这种“模型中立”策略降低了客户的迁移成本,也符合企业对供应商锁定的顾虑.

       
AgentForce Vibes:让2100万开发者拥有 AI 超能力
04


如果说 AgentForce 是面向业务用户的“开箱即用”方案,那么 AgentForce Vibes 就是面向开发者的“低代码 AI 构建器”。
它的核心能力是:用自然语言描述需求,自动生成可运行的应用代码、数据流、UI 界面。


在现场演示中,Patrick Stokes 用不到 5 分钟完成了一个 Dreamforce 指挥中心应用的搭建。
他先上传一份需求文档,描述了需要展示的指标(如平均等待时间、会场扫码热力图)、数据源(Tableau 语义模型)、UI 风格(深色模式 + 蓝色强调色)。
然后输入第一条指令:“构建应用,先从页头开始。”系统立即生成了页头代码和实时预览。接着他输入“添加剩余部分”,系统自动补全了所有图表组件,并完成了数据绑定。

“它知道我要什么,因为我写下了需求,也因为它理解我的业务数据”——Stokes 解释 Vibes 的两大上下文来源。


更进一步,当他要求“把会场扫码数据改成地图展示”时,系统自动调用地图组件库,将条形图替换为热力地图,并叠加了 Moscone 中心的地理坐标。

最后,他让系统“构建一个流程,将吉祥物部署到低活跃度会场”,Vibes 自动生成了 Salesforce Flow 的全部元数据(相当于省去数百次手动点击),并部署到生产环境。
整个过程中,开发者只需用自然语言描述意图,无需手写一行代码。
这背后的技术实现有三个关键点。
  • Vibes 能访问企业的 Salesforce 元数据(包括对象模型、字段定义、权限规则),因此生成的代码天然符合企业数据结构。

  • 它内置了 Salesforce 的最佳实践模板,如 Flow 构建规范、Lightning 组件标准,避免生成不可维护的“野代码”。

  • 它支持迭代式开发——开发者可以先生成基础版本,再通过追加指令逐步完善,而不是一次性输出完整应用。
Vibes 的目标用户不仅是专业开发者,还包括业务分析师、管理员等“公民开发者”。
Salesforce 有 2100 万注册开发者,但其中大部分是兼职或低代码用户。Vibes 的出现意味着这些用户也能参与 AI 应用构建,而不必等待 IT 部门排期。
这对企业 AI 普及具有杠杆效应:
当构建成本从数周降至数分钟,试错空间被大幅打开。

       
行业案例:从零售到制造的agent化实践
05


Dreamforce 现场展示了五家企业的 AgentForce 应用案例,覆盖零售、物流、消费品、制造等行业。
这些案例揭示了agent化企业的三种典型模式。
第一种是“客服增强型”。
Williams-Sonoma 部署了名为 Olive 的 AI 厨房助手,它不仅能推荐食谱和烹饪视频,还能根据客户购买的厨具(如荷兰烤锅)定制内容。关键在于,Olive 能访问客户的购买历史、浏览行为、会员等级,因此推荐的精准度远超通用 AI 助手。这个agent在发布首周末就上线,体现了 AgentForce 的快速部署能力。



第二种是“流程自动化型”。
FedEx 和 Eaton(电气设备制造商)用 AgentForce Field Service 武装现场技术人员。
当工程师上门维修时,AI agent会实时分析设备日志、调取历史故障记录、推荐维修步骤,甚至预判可能需要的备件。
洛杉矶爱迪生电力公司在野火后逐杆逐树检查电网时,就依赖这套系统协调数千名现场人员。
这种模式的价值在于:AI 不是替代人工,而是让每个一线员工都拥有“专家级决策支持”。


第三种是“供应链协同型”。
Dell 用 AgentForce Supply Chain 管理 2 万家供应商,agent能自动处理订单确认、库存预警、物流协调等高频低价值任务,让采购团队专注于战略谈判和风险管理。
这个案例的特殊之处在于,agent不仅对内服务(Dell 员工),也对外服务(供应商),形成了跨组织的协同网络。
这些案例的共同特征是:AI agent嵌入现有业务流程,而非创造全新流程。
这符合企业 IT 的渐进式演进规律——激进的流程重构往往因变更管理成本过高而失败,而“在原有流程上叠加 AI 能力”则阻力最小。
Salesforce 将这种策略称为“增强而非替代”(Augment, Not Replace),并在产品设计中刻意保留人工干预接口

       
技术边界与未解问题
06


尽管 Dreamforce 展示了大量成功案例,但 Salesforce 也坦承了 AI agent的三大局限。
第一是“幻觉”问题。
大语言模型仍会生成看似合理但事实错误的内容,尤其在处理边缘场景或过时数据时。
Salesforce 的应对方案是 AgentScript。

但这也意味着开发者需要预判哪些场景需要硬编码,这本身就是一种专业能力。


第二是上下文窗口限制。
即使最先进的模型,也无法在单次对话中处理企业全量数据。
Salesforce 通过语义检索和向量数据库缓解这个问题,但当客户问题涉及跨系统、跨时间跨度的复杂关联时,AI 仍可能“看不全”。
这要求企业在数据治理上做更多前置投入——脏数据喂给 AI,只会得到脏答案。


第三是成本与延迟的平衡。
调用大模型的 API 成本远高于传统规则引擎,且推理延迟通常在秒级。
对于高并发、低延迟场景(如电商促销期的客服),企业需要在“AI 优先”与“规则兜底”之间动态切换。
Salesforce 的全渠道监督器提供了这种切换能力,但如何设定切换阈值,仍需企业根据业务特性调优。
此外,Salesforce 避而不谈的一个问题是:
AgentForce 对中小企业的适用性
演示中的客户多为财富 500 强,他们有专业 IT 团队、完善的数据基础设施、充足的预算。
但对于年收入千万级的中小企业,部署 AgentForce 的前置成本(数据清洗、流程梳理、员工培训)可能超过其承受能力。
Salesforce 需要在“企业级能力”与“中小企业可及性”之间找到平衡点。


       
从 Dreamforce 看企业 AI 的三个方向
07


Dreamforce 2025 释放的信号不仅关乎 Salesforce,更折射出企业 AI 的三个演进方向。
第一,从“模型竞赛”转向“上下文竞赛”。
OpenAI COO Brad Lightcap 在现场强调,模型能力的提升是基础,但真正解锁价值的是与企业系统的深度集成。
这意味着未来的竞争壁垒不在于谁的模型参数更多,而在于谁能更快地将模型能力转化为业务成果。
Salesforce 的优势在于其 26 年积累的客户数据平台和行业知识,这是纯模型公司难以复制的。


第二,从"单点工具"转向"agent网络"。
企业 AI 的终局不是一个万能聊天机器人,而是由数十上百个专用agent组成的协同网络.
这些agent各司其职,但通过统一的上下文层和编排引擎协作.
这种架构更符合企业的组织结构——就像企业由不同部门协同运作,AI 系统也应是多agent分工合作.


第三,从“技术采购”转向“能力建设”。

AgentForce Vibes 的推出表明,Salesforce 不仅要卖产品,还要培养客户的 AI 构建能力。

这类似于云计算早期,AWS 不仅提供服务器,还通过培训和认证体系培养了一代云原生开发者。
当 2100 万 Salesforce 开发者都能用自然语言构建 AI 应用时,整个生态的创新速度将呈指数级增长。
但这三个方向也带来新的挑战。
上下文工程要求企业具备更强的数据治理能力,agent网络增加了系统复杂度和调试难度,能力建设则需要企业在组织文化和人才结构上做长期投入。
Salesforce 用“客户零号”实践证明了可行性,但其他企业能否复制,仍取决于各自的数字化成熟度。


       
一些启示
08


  • 先解决数据问题,再谈 AI 应用。脏数据、孤岛数据、无语义数据会让任何先进模型失效。投资数据治理的优先级应高于购买 AI 工具。

  • 从高频低风险场景切入。客服自助查询、销售线索初筛、IT 工单分类等场景容错率高、见效快,适合作为 AI 落地的第一站。


  • 保留人工干预接口。AI 不会完美,关键是设计好“人接管 AI”的触发条件和流程,让人机协同成为常态而非例外。


  • 培养内部 AI 构建能力。外采工具只能解决标准化问题,真正的差异化竞争力来自企业自主构建的定制化agent。


  • 用渐进式而非革命式策略。在现有流程上叠加 AI 能力,比推倒重来的阻力更小、风险更低。


Benioff 在演讲中反复强调“AI 应该提升人,而非取代人”。
在可预见的未来,企业 AI 的价值不在于裁员降本,而在于让每个员工都能处理更复杂的问题、服务更多的客户、创造更大的价值。
当 AI 成为每个人的"数字同事"时,企业的运营效率和创新能力才会出现质的跃迁。这或许就是"agent化企业"的真正含义.

END

53AI,企业落地大模型首选服务商

产品:场景落地咨询+大模型应用平台+行业解决方案

承诺:免费POC验证,效果达标后再合作。零风险落地应用大模型,已交付160+中大型企业

联系我们

售前咨询
186 6662 7370
预约演示
185 8882 0121

微信扫码

添加专属顾问

回到顶部

加载中...

扫码咨询