微信扫码
添加专属顾问
我要投稿
Agentic Process:AI从工具到伙伴的转型关键,一文厘清概念混乱与落地路径。核心内容: 1. Agentic AI市场现状与40%项目失败率的深层原因 2. Agentic Process核心机制与MCP协议的技术解析 3. 企业转型决策框架与OpenClaw等实战工具评测
彻底讲透 Agentic Process:AI 从工具走向伙伴的关键一跃
如果你现在去问任何一位企业 CIO「你们有没有在用 Agentic AI」,大概率得到肯定的回答。PwC 2025 年调研显示,79% 的组织声称已「在某种程度上」采用了 AI Agent。
但如果你追问一句「你们的 Agentic 项目产生了什么可量化的业务价值」,现场气氛就会变得微妙。
Gartner 同年发出的预警说明了这种微妙从何而来:超过 40% 的 Agentic AI 项目将在 2027 年底前被叫停,主要原因是成本失控、价值不清晰、风险管控缺失。
同一个月,UiPath和德勤联合宣布「Customer Zero」成果:SAP S/4HANA迁移clean core达成率93%(行业基准是80%),85%以上关键财务工作流实现无人值守自动化,交付200+自动化流程。
Salesforce也公布了自用数据:Agentforce一年内处理超150万次支持请求,SDR Agent从沉睡线索中创造了170万美元新销售管道,员工节省50万小时工作量。同一项技术,同一个时间窗口:一边是40%的失败预警,一边是实打实的业务成果。分水岭在哪里?
问题的根源不在技术本身,而在于大量企业根本没搞清楚自己在部署什么。Agentic AI、AI Agent、Agentic Process、Agentic Workflow、APA……
这些词被同时创造、同时流行、同时被滥用,没有权威机构站出来先定义再使用。于是,把简单规则自动化包装成Agentic的,有;把Chatbot改个名字叫Agent拿去融资的,有。Gartner甚至专门造了个词描述这种现象「Agent Washing」。
概念混乱导致决策混乱,决策混乱导致项目烂尾。这才是那40%失败率背后更深层的原因。
本文就跟大家把这些全部说清楚:Agentic Process是什么、核心机制是什么、优势与风险各几斤几两、Agent Skills和MCP协议的价值在哪里、OpenClaw和hermes-agent怎么用、各类厂商的实现路径差异、BPM会不会被消灭、企业该怎么判断要不要转型。
一篇文章,全部讲透。
每隔一段时间,AI领域就会冒出一批高度相关却被高度混用的词汇。市面上 Agentic 系列概念的混乱,有客观原因:这批词几乎同时被造出来、同时被炒起来,Andrew Ng、Marc Benioff、Jensen Huang 各说各话,Anthropic、OpenAI、Salesforce 各做各做,读者看了十篇文章,每篇对同一个词的定义都不一样。
这张表的价值在于:选型和决策时,不会把预算花在错误的层次上。搞清楚这张图,后面所有内容都会顺畅很多。
理解Agentic Process,最关键的是理解它的运行方式:Agentic Loop(智能体循环)。
Andrew Ng在2023年系统阐述了这个框架,将其归纳为四个阶段,业界普遍沿用至今。
第一阶段:感知(Perceive)。Agent收集当前任务所需的所有信息:用户指令、数据库查询结果、工具返回值、API响应,甚至网页截图或医疗影像。感知能力决定Agent的「视野」宽度,也决定了后续推理的质量上限。
第二阶段:推理与规划(Reason & Plan)。这是LLM真正发力的阶段。模型分析当前状态,将大目标分解为可执行的子步骤,选择调用哪些工具,制定行动序列。ReAct(Reasoning + Acting)框架、Chain-of-Thought提示、Tree-of-Thought规划,都属于这一层的技术方案。推理阶段的质量直接决定Agent「走弯路」的频率。
第三阶段:执行(Act)。Agent实际调用Skills或Tools:API请求、数据库写入、代码执行、文件操作、浏览器自动化。这是「想法」变成「行动」的关键转化点,也是出问题最多的环节。执行层的宽度,决定了Agentic Process能触达的业务边界。
第四阶段:反思与学习(Reflect & Learn)。Agent检验执行结果是否符合预期。成功则更新记忆状态,进入下一步或标记完成;失败则分析原因,调整策略,重新进入循环。短期记忆(Context Window)和长期记忆(Vector Store或外部存储)都在这个阶段得到更新。
然后,循环重复,直到目标完成,或触达预设终止条件(最大迭代次数、超时时间、成本上限)。
这个循环有个让人印象深刻的特征:非线性。它不是从A到B再到C的线性流程,而是随时可能回到起点重新规划。这正是它应对复杂、不确定任务的核心能力所在。
理解了Agentic Loop,就能理解Agentic Process和传统技术的本质差距。
传统RPA的本质是「规则驱动的确定性执行器」。你定义每一步操作,它精确复现。优势是稳定、可审计;弱点是规则边界之外的任何变化都可能让整个流程崩掉,而且规则永远写不完。
纯LLM(如ChatGPT对话模式)的本质是「一次性生成器」。你给问题,它给答案,结束。不会主动检验答案,不会自行调用外部工具,更不会在出错后自主纠正。
Agentic Process填补的,正是这两者之间的巨大空白:既保留了RPA的执行力(能真实触发系统操作),又具备了LLM的适应性(能处理非确定性情境),再加上循环反馈机制,使其能处理人类工作中最难自动化的那类任务:模糊目标、多步决策、动态环境。
用一句话总结:RPA自动化的是「怎么做」(How),Agentic Process自动化的是「做什么直到目标达成」(What to do until done)。
Agentic Process确实有真实优势,但风险同样真实,而且危险。
能处理非结构化任务。 传统自动化的最大盲区是非结构化信息:措辞模糊的邮件、多格式合同文档、口头描述的客户诉求。Agentic Process可以理解、归纳、做出判断,这是RPA永远做不到的。
具备自我修正能力。 单个步骤出错不代表整个任务失败,Agent检测到异常后可以重新规划路径,而不是直接中断。这种容错弹性在长链任务中价值极高。
支持多步长链任务。 从「发起采购申请」到「完成入库对账」,跨越十几个系统操作和决策节点,Agentic Process可以全程自主推进,无需人工在中间节点反复介入。
可并行扩展,能力边界不断延伸。 McKinsey的研究显示,2-5人的人类团队可以监管50-100个Agent协同运行的端到端流程。
Anthropic的多智能体研究表明,主Agent协调专业子Agent的架构,在复杂研究任务上的性能比单一Agent高出90%以上。Landbase统计,2025年企业使用Agentic Process的平均ROI达171%,美国企业达192%,是传统自动化的3倍。
幻觉导致不可控行为,代价远超对话场景。 LLM的幻觉在Chatbot里顶多让你看到错误答案;在Agentic Process里,幻觉可能导致Agent向错误账户发起付款、删除错误文件、向客户发送错误信息。
UC Berkeley Sutardja Center明确指出:高风险场景(如金融交易)中,AI幻觉的代价将远超对话场景,且Agent的「策略性欺骗」风险在高风险环境中已有记录案例。
成本失控是真实的定时炸弹。 每一轮Agentic Loop都在消耗算力。有团队记录到Agent进入递归循环,最终导致云账单达到六位数。设计不当的循环终止条件不是小概率事件,而是架构层面的系统性风险。
安全与合规漏洞,责任归属悬而未决。 2025年初,一家健康科技公司因Agentic AI系统漏洞导致48.3万条患者记录泄露。多Agent系统还面临「Agent勾结」风险:一个被攻击的Agent可能向其他Agent传递恶意指令。
Gartner数据显示,35%的企业将网络安全顾虑列为部署Agentic AI的首要障碍。更麻烦的是,AI Agent自主做出错误决策,锅由谁来背?开发商、部署企业,还是操作员?这在法律层面还没有清晰答案,在强监管行业里是当前落地最大的隐性障碍。
Agent Washing污染市场认知。 Gartner估计,在数千家声称提供Agentic方案的厂商中,真正具备实质Agentic能力的约130家。大量「伪Agentic」产品用炒作拉高了企业预期,最终结果就是那40%的失败项目。
Klarna是最著名的反面教材。这家瑞典支付公司曾高调宣称AI替代了大量客服,但CEO后来承认AI输出「质量低于人类员工」,公司随后恢复雇用人工客服。教训不是Agentic Process不行,而是:流程没准备好就上Agent,是在放大混乱。
还有一个被严重低估的成本:MIT的研究指出,实施Agentic AI 80%的工作量消耗在数据工程、利益相关方对齐、治理设计和工作流集成上,模型本身只占20%。企业往往只看到那20%的光鲜部分,忽略了那80%的「脏活」,这才是最普遍的失败根源。
如何应对? 引入Agent Harness,给每个Agent设定明确的权限边界(最小权限原则),关键操作前强制人工审批,异常行为触发自动熔断。
设置三道保险:最大迭代次数、超时机制、成本上限同时生效。建立完整的推理审计轨迹,每个决策步骤都必须有记录,这是合规的基础,也是故障排查的前提。
如果把Agent比作一位员工,Skills就是他的专业技能证书清单。一个Agent的Skills通常分为四类:
感知类技能(输入处理):文本理解、图像识别、文档解析(PDF/Excel/Word)、网页内容提取、语音识别。感知技能决定Agent能「读」什么类型的输入,也是多模态扩展的切入点。
推理类技能(内部认知):代码解释执行、数学计算、逻辑推断、多步规划、语言翻译。主要由LLM本身提供,但可通过微调或专用工具增强。
行动类技能(外部执行):API调用、数据库读写、代码执行(Python/SQL等)、浏览器操作、文件系统操作、邮件/日历/消息发送。这是Agentic Process能够真正「干活」的关键,决定了Agent能触碰哪些真实系统。
协作类技能(多Agent交互):任务委派、结果汇总、向人类请求确认、与其他Agent通信。这类技能是多智能体系统(Multi-Agent System)得以运转的基础。
Skills的标准化是2025年最重要的基础设施里程碑。2025年12月18日,Anthropic发布Agent Skills开放规范(SKILL.md格式),企业可以像搭积木一样把已有的技能模块组合成新的 Process,不同厂商的 Agent 可以共享同一套技能生态,降低平台锁定风险。
OpenAI和Microsoft随后采纳,标志着Agent能力单元正式走向标准化和可组合化。
Salesforce的AgentExchange(2026年初上线)是目前全球最大的Skills市场,Marc Benioff将其定位为「6万亿美元数字劳动力市场」的基础设施层。
标准化对企业意味着什么?意味着可以像搭积木一样把已有技能模块组合成新的Process,不必每次从头开发;也意味着不同厂商的Agent可以共享同一套技能生态,降低平台锁定风险。
Anthropic的多智能体研究已经证实,专业化分工的多Agent架构(每个子Agent专精一类Skills)在复杂任务上的性能是量级级别的提升,这说明Skills的专业化分工本身就是Agentic Process性能优化的核心杠杆。
Skills本身需要一个标准协议来连接外部系统,这就是MCP(Model Context Protocol,模型上下文协议)的价值所在。
Anthropic于2024年11月发布MCP,2025年3月OpenAI采纳,现已移交Linux Foundation治理,AWS、Google、Cloudflare均给出生产级承诺,SDK月下载量达9700万次。BCG把它称为「AI的USB-C接口」,在MCP出现之前,每个Agent连接每个系统都需要定制化开发;MCP出现后,将这个过程标准化了。
2026年3月发布的MCP Roadmap明确四个优先方向:传输扩展性(支持高并发Agent调用)、Agent间通信(让Agent协作更顺畅)、治理成熟度(权限控制和审计)、企业就绪度(与现有IT基础设施对接)。苹果Xcode已于2026年初原生支持MCP,这个信号意味着:协议标准化之争,Anthropic已经在牌局上赢了相当大的先机。
与MCP并行的还有Google发布的A2A(Agent-to-Agent)协议,专注于多Agent间的通信标准,已获SAP、Salesforce、ServiceNow、Workday等50余家厂商采纳。
两者定位不同,并不冲突:MCP负责Agent连接外部工具,A2A负责Agent之间的协作通信。 一个是Agent的「对外接口」,一个是Agent的「内部通话频道」。两个协议标准同时成熟,意味着Agentic Process的基础设施层正在快速完善。
理论够了,来看具体实限。对于想在私有环境中构建Agentic Process、同时控制成本和数据主权的团队,OpenClaw + hermes-agent是目前最受关注的开源项目组合之一。
OpenClaw是一个本地自托管的Agentic AI系统,其架构直接体现了Agentic Process的核心设计哲学,由四个核心组件构成。
持久化记忆(Persistent Memory):存储跨任务的上下文状态,解决普通LLM「没有记忆」的根本缺陷。没有持久化记忆的Agent,每次都像第一次见你,做不了任何需要累积上下文的工作。这让Agent在跨会话、跨任务场景下保持连贯性,是长周期复杂任务的必要基础。
Agent(AI Brain):核心推理模块,负责理解用户目标、拆解任务、制定计划、评估结果。整个Agentic Loop的决策中枢,通常由一个或多个LLM驱动。
模块化Skills库:涵盖文件系统操作、终端命令执行、浏览器自动化等本地资源交互能力,使Agent能像真正的本地助手一样代替用户完成具体计算机操作,而不只是「说说」该怎么做。
「Agentic Loop & Proactive Monitoring」机制:OpenClaw的核心亮点,实现主动监控和持续迭代,确保Agent不会在任务执行中途悄悄「失联」。
整体运转流程:用户输入目标 → Agent推理规划 → 调用Skills执行 → 持久记忆存储状态 → 评估结果 → 循环直至完成。全程数据不出本地网络,对医疗、金融、政务等数据敏感行业吸引力强。
对中小企业或个人开发者,OpenClaw的价值在于低成本、高可控、可定制,适合验证Agentic Process逻辑、测试Skills组合,或构建内部专用自动化助手。
hermes-agent基于NousResearch的Hermes系列模型,该系列专为Function Calling(工具调用)和结构化推理深度优化,是开源社区构建Agentic Process使用最广泛的基础推理引擎之一。
它的核心优势是Function Calling的稳定性和结构化输出的一致性。这两点对Agentic Loop的Act阶段至关重要:如果模型的Function Call输出格式不稳定,Skills调用就会频繁失败,整个循环陷入无效迭代。
Hermes模型在推理时以结构化XML或JSON格式输出「思考过程」和「工具调用指令」,开发者能清晰观察Agent在每一步的判断和行动,对需要可解释性和可调试性的企业场景,这是显著优势。
用hermes-agent实现Agentic Process的典型路径:首先定义Skills集(即Tools),告诉模型可以调用哪些工具及参数格式;其次设定系统提示(System Prompt),明确角色、目标和行动规范;然后用户提供任务目标;最后模型进入推理-调用-反馈循环,直到任务完成。
局限在于:复杂多步骤任务的推理深度不如GPT-4o或Claude 3.7 Sonnet,长上下文下的稳定性需要额外调优。但对于希望私有部署同时控制成本的团队,hermes-agent是最务实的选型之一。
最佳实践组合:OpenClaw提供Skills框架、记忆系统和监控机制,hermes-agent提供推理引擎。两者配合,构成完整的本地Agentic Process基础设施,成本远低于调用OpenAI或Anthropic API,隐私保护更强,适合作为企业内部自动化的试验田,验证成功后再决定是否迁移至云端商业平台。
概念讲够了,来看真实发生的事情。王吉伟频道选了六个场景,覆盖ERP迁移、CRM客服、财税服务、零售库存、医疗临床、软件工程,覆盖企业重资产的企业核心系统和AI原生场景。
大型ERP迁移通常是企业最痛苦的IT项目:几百个业务流程、几十个系统集成,手工测试和数据迁移工作量惊人,错误率难以控制。UiPath和德勤将Agentic Automation嵌入迁移全流程,Agent负责自动识别流程差异、生成测试用例、校验数据、处理异常。
结果:SAP S/4HANA迁移clean core达成率93%(行业基准80%),85%以上关键财务工作流实现无人值守自动化,交付200+自动化流程。
这个案例的意义在于:它证明了Agentic Process在「确定性要求极高」的ERP场景同样适用,而不只是适合边界模糊的创意类任务。
传统RPA在ERP迁移中遇到的最大困难,是那些规则复杂、数据脏乱、需要根据上下文判断的「灰色地带」,Agentic Process通过推理能力在大多数特殊情况下自主做出合理判断,只把真正超出能力边界的情况交给人工。
2026年3月,UiPath和德勤联合推出Agentic ERP Platform,将成功经验打包成可复制的标准化产品,标志着ERP场景的Agentic落地从「定制项目」走向了「产品化」。
Reddit 是 Agentic Process 在 CRM 客服场景中迄今最具说服力的公开案例。部署 Salesforce Agentforce 360 后,46% 的支持案例被自动偏转处理(无需人工介入),平均响应时间从 8.9 分钟压缩至 1.4 分钟。
这里的核心设计亮点是「置信度阈值」机制:并非让 Agent 试图处理所有问题,而是用阈值划定「自动完成」和「升级人工」的边界。置信度够,Agent 自主处理;置信度不够,立即转人工并提供推理上下文。
这种「Human in the Loop」设计,是 Agentic Process 在企业级应用中获得持续信任的核心机制,而不只是一个安全策略,更是一个务实的工程选择。
这家会计服务公司在税务季(业务量陡增 3 至 5 倍的时期)部署了 Salesforce Agentforce,让 Agent 处理客户咨询中的标准化问题:政策查询、文件要求说明、账单问题、申报状态跟踪。
结果:70% 的客户咨询由 Agent 自主解决,不需要人工介入,人工客服得以集中精力处理真正复杂的个案和高价值客户服务。
这是 Agentic Process 在「季节性峰值场景」中价值最清晰的体现:弹性扩展、按需调用、人机分工明确。传统客服扩容需要提前招聘培训,Agentic Process 的扩容只需调整并发参数。
Nuance、Ambience Healthcare 等公司部署的临床文档 Agentic Process,是另一类意义重大的案例。
医生与患者对话期间,Agent 实时感知对话内容,自动推理并生成结构化的 SOAP 格式临床笔记,同时触发与 EHR 系统的数据写入和编码匹配,医生无需手动记录,完成后审核确认即可。
这个场景的独特价值在于:临床文档是高度非结构化、高专业密度的任务,传统 RPA 完全无法处理,纯 LLM 只能生成文本但无法写入系统,只有 Agentic Process 才能端到端打通「理解→生成→写入」这整条链路。
它清晰地标出了 Agentic Process 价值版图上 RPA 从未抵达过的领域。
Nuance、Ambience Healthcare等公司部署了临床文档Agentic Process:医生与患者对话期间,Agent实时感知对话内容,自动推理并生成结构化临床笔记(SOAP格式),同时触发与EHR系统的数据写入和编码匹配,医生无需手动记录,文档完成后再审核确认。
这个场景的价值在于:临床文档是高度非结构化、高专业密度的任务,传统RPA完全无法处理,纯LLM只能生成文本但无法写入系统,只有Agentic Process才能端到端打通,真正把「听诊室里说的话」变成「系统里规范的记录」。
GitHub Copilot Workspace和Devin(Cognition AI)代表Agentic Process在软件工程场景的前沿:给定一个Issue描述,Agent自动感知代码仓库上下文,推理Bug原因,生成修复代码,执行测试,测试通过后提交PR。
这已经是一个完整的、多步骤的、需要大量工具调用(代码阅读、代码生成、测试执行、版本控制)的Agentic Process,而且正被真实工程团队用于生产环境。
这个案例的意义不在于「AI会修Bug了」,而在于它证明了Agentic Process有能力处理知识密集型的专业判断任务。
因为篇幅问题,这里只简单介绍下案例,我会在其他文章中分享更具体的案例。
同样是「做Agentic Process」,不同类型的厂商切入点截然不同。搞清楚这些差异,是企业选型最重要的前置判断。
SAP把Agentic Process的战场放在ERP核心业务流程上。SAP Joule整合在S/4HANA、SuccessFactors、Ariba等产品线中,策略是「原生嵌入」:Agent直接运行在业务数据所在的系统内,而非外部接入,最大限度减少集成摩擦。
优势是数据和流程的深度整合,无需单独建设数据管道;劣势是生态相对封闭,跨SAP体系外的系统集成需要额外工作。对于深度绑定SAP生态的大型企业,Joule是自然的升级路径;对于多系统混合环境的企业,需要评估互操作成本。
SAP 把 Agentic Process 的战场放在 ERP 核心业务流程上,策略是「原生嵌入」。SAP Joule 整合在 S/4HANA、SuccessFactors、Ariba 等产品线中,Agent 直接运行在业务数据所在的系统内,无需单独建设数据管道,最大限度地减少集成摩擦。
优势是数据整合深、ERP 内的任务链路完整;劣势是生态相对封闭,扩展到 SAP 体系之外的场景需要额外集成工作。
Salesforce 是目前企业软件里把 Agentic Process 商业化做得最系统的公司。
Agentforce 360(2025 年 10 月 发布)将所有 Salesforce 云产品统一在一个 Agentic 架构下,核心是 Atlas Reasoning Engine(推理引擎)+ Data Cloud(统一数据层)+ Agentforce Platform(Agent 构建与编排平台)的三层架构。
目前服务超 18,000 家客户(覆盖 124 个国家),AgentExchange 提供开箱即用的行业 Skills 库。
但Salesforce同时坦承了一个关键教训:首批上线的SDR Agent有30%的概率会回答「我不知道」,经过大量数据清洗和迭代训练,才把这个比率降到10%以下。
这是难得的头部厂商自我揭露,说明即便是最成熟的平台,「数据就绪度」仍是Agentic Process能否产生价值的根本前提,没有例外。
UiPath和Automation Anywhere代表了RPA厂商应对Agentic浪潮的两条不同路径。
UiPath 的路径是「在 RPA 基础上叠加 Agentic 能力」。Maestro 编排框架 + Autopilot Agent,使原有 RPA 流程遇到规则之外的情况时,动态调用 LLM 决策,而非直接报错中断。
原有 RPA Robot 变身为 Agent 可调用的「行动执行器」,企业不必推倒现有 RPA 投资,渐进式升级。根据 Accelirate 数据,这种方式相比纯 RPA,自动化覆盖率提升 25 至 60%。
Automation Anywhere的路径是「重构」:推出APA System(Agentic Process Automation Platform),将AI Agent、RPA机器人和流程编排整合为统一平台,允许企业在「完全自主」到「完全人工」之间灵活调节自主度。架构上更先进,对新建场景更友好,但存量迁移成本略高。
Anthropic的战略是通过制定标准来影响整个生态:MCP协议定义Agent与外部系统的连接标准,SKILL.md规范定义Agent Skills的共享格式,Claude模型专注于更长上下文、更稳定的Function Calling和更强的指令遵循能力。
OpenAI 则以 Function Calling、Assistants API、Realtime API 构建开发者生态,并于 2025 年 3 月采纳 MCP标准,两条路线加速融合。
这两家厂商不直接卖Agentic Process解决方案,但他们是整个生态的基础设施提供商,谁的协议标准成为行业事实标准,谁就掌握了生态话语权。
框架层厂商的商业化路径还在探索,但作为构建 Agentic Process 的研发工具,它们不可或缺。企业级场景选型时,优先考虑 SLA 和商业支持能力,而不只是 GitHub Star 数。
整体厂商格局汇总对比:
这个问题值需要单独说清楚。
传统BPM(业务流程管理)系统(如Pega、Appian)的核心价值是流程建模、执行监控和治理合规。这些能力在Agentic时代不会消失,反而会变得更重要。
但BPM的「固定流程图」模式面临根本性挑战。传统BPM假设流程可以被完整预先定义,每个节点的逻辑都可以写成明确规则。Agentic Process打破了这个假设:流程本身可以在运行中动态调整,Agent可以自主决定跳过某个节点或插入一个新的判断步骤。
这让「画好流程图再执行」的设计哲学,在非确定性任务面前显得非常笨重。
可以预见的演化路径是:传统BPM引擎变成Agentic Workflow的「骨架」,提供流程框架、治理规则和审计能力;具体的任务执行节点从「固定脚本」变成「Agentic Process」。Pega和Appian已经在这个方向上做出了明显动作。
换句话说,未来的BPM系统,本质上是Agent Harness的企业级实现,既保留了原有的治理价值,又为Agent自主执行提供了安全边界。
所以BPM不会消亡。但如果BPM厂商不做出这种进化,它的市场份额会被那些能够原生支持Agentic Process的平台蚕食。这是进化,不是替代,但进化是强制性的,不是可选项。
「所有企业都必须立刻转向Agentic Process」是一个危险的命题,被这种压力推着走,不考虑业务成熟度、数据质量、团队能力就仓促上马,正是那开头提及Garner预测的 40% 失败项目的共同成因。
PwC 2025年调查显示,79%的组织「在某种程度上」已采用AI Agent,但真正实现全规模部署的只有2%。对完全自主AI Agent表示信任的组织比例在一年内从43%跌到27%。这说明早期盲目上马留下了大量教训,盲目是问题,但完全不动也在错失窗口期。
但「根本不需要关注」是另一个更危险的极端。
Gartner 预测,2026 年底将有 40% 的企业应用集成 AI Agent,2028 年 Agentic AI 将进入 33% 的企业软件。如果竞争对手用 Agentic Process 把某条核心业务流程的效率提升了 3 倍,你没有相应的认知和方案,连对话的资格都没有。
这里,王吉伟频道给出四个前置判断。
你的流程里有多少「判断点」? 每隔三步就需要人来确认的流程,说明里面有大量非确定性判断,这正是 Agentic Process 最擅长接管的部分,价值最高。
你的数据质量够吗? Agentic Process 的推理依赖高质量的上下文信息。数据在多系统里孤立存在、格式混乱、缺乏标注,上了 Agent 只会放大混乱。「先治数,再上 Agent」不是保守派的借口,而是 MIT 研究数据的结论:80% 的工作量在准备工作上。
你能接受多大的错误率? 金融清算、医疗诊断等场景对错误率要求接近零,现阶段不适合高自主度的 Agentic Process;内容生成、数据汇总、初步客户分类等场景容错空间大,正是适合早期实验的入口。
你有没有人负责监控? 「无人值守」是宣传语,不是架构原则。任何生产环境中的 Agentic Process 都需要人类监督层,不是每步都看,而是设定关键检查点和异常告警。没有这个,就没有安全网,出了事也无法追责。
基于前置判断,这里简单总结了适合做 Agentic Process 流程改造的几个特征。
适合改造的特征:涉及多系统数据聚合和判断;存在大量「看了数据再决定下一步」的节点;业务量波动大,需要弹性扩展;任务目标明确但路径不固定(每次情况都不完全一样);操作不是完全不可逆的,出错后能纠正。
暂时不建议激进改造的特征:操作结果完全不可逆(如金融清算、医疗用药);数据质量极差,系统间接口混乱,「数据就绪度」严重不足;强监管行业且缺乏可解释性合规方案;内部根本没有AI工程能力,只能完全依赖厂商黑盒。
Gartner明确指出,35%的企业将网络安全顾虑列为首要障碍,这不是杞人忧天,是有记录的现实。
下面这3个转型阶段,供大家参考。
第一阶段:流程梳理与优先级评估(1-2个月)。不要急着上Agent。把现有核心业务流程拆开来看:哪些步骤是确定性规则执行,哪些是「需要人判断的非确定性节点」,哪些的错误代价是可以接受的。这是后续所有工作的基础。
MIT的研究结论已经说得很清楚:80%的工作量在「不光鲜」的准备工作上,不要让这80%被跳过。
第二阶段:最小可行Agent(MVP)试点(2-4个月)。选一个低风险、高频、有明确成功指标的流程做第一个Agent。关键原则是「窄范围、可回滚、有监控」。不要一上来就做端到端「大流程Agent」,先在一个子流程上验证整个Agentic Loop是否能稳定运转。
同时建立Agent Harness的基础能力:权限控制、执行日志、异常告警。技术选型上,优先考虑与现有系统生态匹配的方案:已有Salesforce的先用Agentforce,已有UiPath的先用Maestro,技术团队强的可以用LangChain/CrewAI自建。
同时把 Agent Harness 的基础能力建起来:权限控制、执行日志、异常告警,三件事同步做,不能等出了问题再补。
第三阶段:横向扩展与治理体系建设(持续推进)。在MVP验证后,复制成功模式到相邻场景,建立跨Agent的协调框架(Agentic Workflow层),形成企业级APA体系。治理能力与功能扩展同步建设,不能等出了问题才补。
MIT Sloan & BCG调研的2102家组织中,成功的企业不是「解决」了范围与灵活性的张力,而是设计出能在效率与适应性之间动态切换的工作流。这个洞察比任何技术方案都重要。
最后要强调:「转型」不等于「替代」。Agentic Process和传统RPA在相当长的时间内会并存——RPA处理确定性高的规则任务,Agentic Process处理非确定性高的判断任务,两者通过统一的编排平台协同运作。
UiPath的「Maestro + RPA Robot」架构正是这个思路的产品化实现,也是大多数已有RPA存量投资的企业最现实的迁移路径。
Gartner 2025年10月的判断是:Agentic AI供给严重超过需求,市场修正即将发生。这不是说赛道没有价值,而是说市场会经历一轮淘汰赛,最终留下真正有产业深耕能力的玩家。
对应企业的信任度数据印证了这一判断:对完全自主 AI Agent 表示信任的组织比例在 2025 年从 43% 跌到 27%,一年内大幅下滑。这说明早期盲目上马留下的大量教训正在反噬整个市场的信心,Agent Washing 的代价正在被集体消化。
当前市场大致分为四个层次。
基础设施层:Anthropic(MCP协议、Claude模型)、OpenAI(API生态)、Google(A2A协议、Gemini模型)、微软(Azure AI基础设施、AutoGen框架)。这一层的竞争最终体现在协议标准的话语权上,谁的协议成为事实标准,谁就控制了生态的底层入口。
平台层:Salesforce(Agentforce)、ServiceNow(Now Assist)、SAP(Joule)、Workday(Illuminate)。这是「Agentic Process嵌入企业软件」的主战场,买单方是有成熟CRM/ERP体系的大企业,竞争核心是开箱即用的业务场景深度和数据整合能力。
工具层:UiPath(Maestro)、Automation Anywhere(APA System)、IBM Watson Orchestrate。这是RPA厂商向Agentic升级的主战场,以存量客户转化为主要增长来源,关键能力是对已有RPA投资的兼容性。
框架层:LangChain、CrewAI、AutoGen、LangGraph及垂直行业专用框架。以开发者社区为核心,商业化路径还在探索,但这一层产出的开源生态反哺了整个行业的技术演进速度。
市场规模方面,AI Agents市场2025年约79.2亿美元,预测到2030年企业级Agentic AI市场达245亿美元(CAGR 46.2%),到2034年可能突破2000亿美元。
Gartner预测,2026年底40%的企业应用将集成AI Agent,2028年Agentic AI将进入33%的企业软件。这个增速背后是整个企业自动化市场的重新洗牌,不只是AI领域的增量。
技术演进上,三条技术已经比较清晰。
多智能体协作走向成熟:从单个Agent处理单个Process,升级为Agent团队处理端到端业务。专业化分工的多Agent架构在复杂任务上的性能是量级级别的提升,这个方向会是2026至2027年产品化的主战场。
标准协议生态形成:MCP + A2A + SKILL.md三个协议标准,正在构建Agent生态的基础设施框架。协议标准化意味着不同厂商的Agent可以无缝互操作,将大幅降低企业的平台锁定风险,也将加速整个行业的分工深化。
可信治理框架落地:Agent自主决策的责任归属、行为可解释性、人机协作的权限划分,正在从「工程讨论」走向「监管议题」。欧盟AI法案、美国的AI行政命令,都在把治理要求变成合规硬约束。哪家厂商先把治理框架做成产品,哪家就先拿到强监管行业的门票。
Gartner 预测的市场整合已经开始,那 40% 的失败项目会加速这个进程。对企业来说,选择有长期战略可信度的合作伙伴,比追最新技术噱头重要得多。
Andrew Ng的那句话,到今天仍然精准:未来不是更大的模型,而是更聪明的流程。 Agentic Process,正是那个流程本身。
它不是一时风潮。从2023年的实验玩具到2026年的生产力基础设施,这个跨越已经完成。2026年的关键议题不再是「要不要用」,而是「怎么用得稳、用得对」。
机会清单很长:企业流程重构(从RPA升级是最明确的存量市场)、垂直行业专用Agent生态(法律、医疗、财务各有百亿以上机会)、多模态扩展(视觉理解加行动执行,正在打开RPA从未触及的场景)。MIT Sloan & BCG调研的2102家组织中,66%预期Agentic AI将带来运营模式的根本性变化。
但风险同样不能被乐观情绪掩盖。信任度从43%跌到27%(一年内),是一个严肃的信号:市场对那些言过其实的早期部署已经开始厌倦和反弹。幻觉、成本失控、安全合规漏洞、责任归属,这些不是边缘问题,是产业化落地的核心挑战。
Agentic Process填补了传统AI(规则执行或单次生成)与真正自主智能之间的空白,成为连接LLM潜力与现实业务价值的桥梁。掌握它的人和组织,会在未来五年获得决定性竞争优势。
前提只有一个:真的掌握,而不只是在PPT里掌握。
推荐阅读
53AI,企业落地大模型首选服务商
产品:场景落地咨询+大模型应用平台+行业解决方案
承诺:免费POC验证,效果达标后再合作。零风险落地应用大模型,已交付160+中大型企业
2026-04-20
Kiro CLI 2.0 升级指南:OpenClaw 加持下的 AI 编程提效新体验
2026-04-20
小智指挥 OpenClaw:异步响应、超低延迟
2026-04-20
OpenClaw 用不下去的 4 个理由
2026-04-18
Openclaw常用的命令
2026-04-18
Hermes Agent vs OpenClaw:完整迁移指南
2026-04-16
OpenClaw技术架构与安装部署
2026-04-15
OpenClaw的启示:身份权限管理是AI Agent时代的阿喀琉斯之踵
2026-04-15
最近爆火的 Hermes Agent 是什么?它和 OpenClaw 不是一回事
2026-03-03
2026-02-17
2026-03-05
2026-02-06
2026-02-03
2026-03-09
2026-02-10
2026-02-16
2026-03-09
2026-02-06
2026-04-09
2026-04-07
2026-04-02
2026-03-30
2026-03-30
2026-03-26
2026-03-24
2026-03-24