微信扫码
添加专属顾问
我要投稿
AI Agent领域的真实情况与挑战,专家深度解析。 核心内容: 1. AI Agent定义与炒作现象 2. 技术瓶颈与实际业务价值衡量 3. AI投入ROI的四个维度分析
如何定义 AI Agent?如何看待 AI Agent 领域存在的过度炒作现象?如何找到 AI Agent的最佳切入点?哪些关键 KPI 可以验证 AI Agent 项目的实际业务价值?
在崔牛会策划的“DeepTalk|DeepSeek猜想系列”对话中,由崔牛会创始人&CEO 崔强主持,邀请了 Gartner 公司副总裁孙鑫(Julian Sun),围绕“真假 AI Agent:贴牌陷阱vs技术泡沫”的主题,展开了深入探讨。
孙鑫提到,目前国内的AI Agent正处于一个顶峰点,未来两到五年,AI Agent可能进入生产的成熟期,但目前企业对于AI Agent 的探索还应保持相对谨慎的态度,技术瓶颈、可靠性、成本、场景适用性仍是重要的制约;Deep Seek 拉平了很多企业在应用大模型技术上的差距,但企业更应考虑的是让自身数据与大模型产生协同效应,让大模型为自己所用;在谈及如何衡量 AI 投入的 ROI 时,孙鑫提到了效率、质量、财务和安全四个维度。
阅读目录
1. “Agent Washing” :热闹背后的理性思考
2. 回归客户期待:如何定义AI Agent?
3. AI重力+用户使用:大模型时代的“护城河”
4. AI 投入的衡量指标和落地“三步走”
崔强:今天聊一个大家比较关注的话题:真假 AI Agent,到底是贴牌陷阱,还是一个技术泡沫?今晚的嘉宾是Gartner公司副总裁孙鑫。今晚的话题,也源于Gartner 的一篇文章,文章题目是「Gartner: 警惕 “Agent Washing” ,辨别炒作与实质」。
Agent到底是不是新瓶装旧酒?这在国内外都是一个很常见的问题。针对这一问题,Gartner给出了一个非常严苛的AI Agent定义标准。在Gartner眼中,到底什么才是真正的AI Agent?怎样定义企业级的 AI Agent?目前 Salesforce以及国内很多厂商也都推出了 AI Agent 产品,这些产品到底算不算AI Agent?今天晚上我们就聊一下这个话题。请孙总先介绍一下自己,然后介绍一下写这篇文章的背景。
孙鑫:好的,谢谢崔老师。我叫孙鑫,大家可能更熟悉我另外一个名字Julian。我就职于Gartner,Gartner是一家美国研究型咨询机构,专门服务于全球的首席信息官,即 CIO 以及他们的团队,包括大数据主管,以及企业的 AI 一号位等人群。我主要负责Gartner中国区的研究团队,主要研究方向是人工智能和数据分析。
这篇文章来源于美国人常说的一个词: “FOMO”(错失恐惧症,Fear of Missing Out),意思是企业或者个人害怕忘记了(错过了)什么事情,实际上这样的事经常发生。比如很多年以来,国内非常多的厂商都称自己为某某云(Cloud),再往前几年是某某中台,十几个月之前是某某GPT,到了今天可能就是某某 Agent。
我们觉得 “Agent Washing” ,是指这样一种现象:在供应商侧,将它们现有的技术重新包装成Agent,而这些“现有的技术”,实际上是缺乏一些产品的自主性和复杂决策能力的,这样就导致了甲方企业市场的混乱,或者出现误导性投资。
我们看到很多组织或者企业过度支出,并且大大低估了现在部署AI Agent 的成本和复杂性,最终可能无法达到过度炒作所带来的期望,这就是我们写这篇文章的一个初衷。
崔强:在当前背景之下,厂商肯定愿意去占AI Agent这个概念。以往大数据出来,大家都是大数据公司。现在 AI 出来,大家都是 AI 公司。 “Agent Washing”,在当前市场主要表现为哪些特征呢?
孙鑫:这些特征很明显:一种是比较简单粗暴的,比如改名字。原来的 RPA 公司,或者应用公司,直接变成AI Agent 公司,这属于一种营销侧的“极简叙事”,它可能对产品的逻辑性上并没有过多追求,却极具煽动性,能够将一般用户吸引过去。
AI 产品比较有意思,它服务的更多是 Prosumer用户(参与生产的消费者),而不是一般的 Consumer 用户(消费者用户),它相对于专业型消费者用户是有触达力的。所以一旦厂商把名字改成Agent,就会极大地吸引一些 to C 端比较喜欢钻研新产品的用户尝试。很多厂商的产品,在几个月前叫某某Copilot,之后又改成某某 Agent。
分享一个Gartner数据:我们 2024 年 Q2 到 Q4 关于 Agent 的咨询量增长了750%,这是一个非常惊人的数字。但据我们关于甲方 Agent 部署的调研来看,成功率不到 30% 。看起来非常热闹,但真正做出成果,部署成功的比例其实非常低。
所以,这一场 “Washing”,对于很多乙方也许有一定的成功意义,但对于甲方来说还远谈不上成功。
崔强:刚才你提到两个数据, 关于 Agent 的咨询量增长了750% ,但只有 30% 的客户成功部署了 AI Agent。成功部署的场景主要集中在哪些方面?
孙鑫:其实这 30% 的客户,很多可能并不一定是 AI Agent,更多可能是一个Workflow(工作流技术)。我们看到的客服,知识库的 Agentic RAG (智能体增强检索生成)模式,Coding(软件研发)模块,都是一些比较成功的场景类别。
崔强:国内外的整体趋势相似吗,还是有区别?
孙鑫:国外的选择可能会更多一些。无论是什么技术型产品,都存在一个“buy or build”(购买或自建)的选择。
在 ChatGPT 的初始阶段,我们看到国内外市场的一个明显区别:国内企业是 build (自建)的模式,而国外企业则是 buy (购买)的模式,这和 SaaS 的部署非常类似。但在自建过程中,中国的企业客户可能会面临非常多的技术局限性。
然而自今年 1 月份开始,尤其是 DeepSeek 的崛起,在推理模型对于 Agent 的助力之下,这种情况出现了一个非常大的变化。据我们去年 6 月份的一项调研,中国企业客户生成式 AI 的部署成功率是8%,当时全球的成功率在23~24%左右;今年这个数字虽然还没有发布,但国内企业已经非常接近全球化水平了。所以,DeepSeek对于这件事是有推动性的。
崔强:是的,原来和 IT 行业不相干的人都在谈论如何使用DeepSeek。刚才你提到两个数据,包括Gartner技术曲线,现在看来这波生成式 AI 处于技术曲线的哪个位置?
孙鑫:我可以简单地介绍一下Gartner技术曲线。Gartner觉得所有技术趋势基本上都会遵循一个技术成熟度曲线(The Hype Cycle,炒作曲线),一开始会进入技术萌芽期:当一项新技术取得突破进展,或者进行大规模传播时,会引起媒体和行业的极大兴趣,我们称之为技术萌芽期;然后会进入期望膨胀期。当外界对于一项技术趋势给予过高热情和不切实际的期待时,一些领军企业可能会大力宣传,但往往只有一小部分取得成功。
我认为,目前生成式 AI 正处于期望膨胀期,国内的Agent正处于一个顶峰点,大家期望非常高,甚至有些厂商宣称做出了通用的 AI Agent,但实际上这件事是不太可能的;之后有些技术会进入到泡沫破裂的低谷期,从最高点跌落到最低点,再逐渐进入一个稳步爬升的复苏期。随着新技术的融入,以及更多商业化方法论和工具的实现,最终达到成熟期。
(图源Gartner网站)
每一个阶段,我们都会给予客户一定指导,评估技术投入策略。在我们对 AI Agent的技术成熟度曲线中,对它有一个benefit(有益性)评级是非常高的。
另外,我们预测在两到五年内,AI Agent可能进入生产成熟期,AGI 实现要更早到来。从某种程度来讲,Agent 为很多企业实现愿望提供了一个很好的渠道,包括 MCP 等辅助技术的出现,很多企业觉得过去不能干活的大模型现在可以帮我们干活了,这也是一些甲方侧的期待被厂商实现的例子。
崔强:我们看到,当年SaaS被资本追捧的情形在 AI 端重现了。我感觉 AI 可能比SaaS更快地进入Gartner技术曲线的周期里面。在AI技术的投入上,结合当下中国 AI 的状态,你会给厂商什么样的建议?
孙鑫:我建议现在对于AI Agent 的探索相对谨慎一点比较合适。首先,现在的AI Agent 还存在非常多的瓶颈或者技术局限性,还没办法做出一个非常好的Agent。
其次,最常见的问题还是它的可靠性。现在的 AI Agent 是依赖一些不可靠的组件构成的,最常见的组件就是大语言模型。假设一个AI Agent工作流包括 10 个步骤,每个步骤都基于大模型推理,大概有 10% 的出错概率,整体下来一个Agent真正的正确率可能只有1/3左右,这种错误的累积其实对于企业是不太可以接受的。
第三,成本问题 。如果不计成本地使用token,让 AI Agent 去实现一些任务,对企业未必是一个合适的选择。所以,更多企业面对的问题是:是否真的有必要去建一个Agent ,或者是否一定要把项目做成Agent?因为 Agent 的复杂性和它的价值都是同比例增长的。
此外,Agent 也不是适用所有应用场景。不是所有场景、所有公司现在都需要去做 Agent 这件事情。
崔强:刚才你提到 AI Agent 只适合某一些场景,现在国内还有哪些场景,用 AI Agent 是能够在低成本并且相对可靠的状态下实现的?
孙鑫:分成四个维度看这个问题会比较合适。第一,复杂度。是不是足够复杂,需要足够多的步骤,需要在一个足够不可控的外界环境下实现,这可能是比较适合AI Agent的场景;第二,收益。能不能带来足够多的收益;第三,现有技术的可行性;第四,这件事的出错率。
结合这几个维度,你会发现写代码是非常适合做成 Agent 的。首先,写代码这件事足够复杂;第二,请一个程序员成本很高,尤其在北美地区;第三,现在 AI 写代码已经比较靠谱了,比如Claude 3.7 Sonnet 已经可以做到非常好了;此外,写代码可以通过一个非常严苛的测试去检测。
结合以上四个维度,可以很好地判断一件事值不值得通过 Agent 来实现。
崔强:一个网友问,有哪些比较好的,已经走通的智能体商业化例子?
孙鑫:现在市面上比较认可的几个 Agent 大家可能都听过,比如 OpenAI 的 Deep Research,是一个研究型的智能体;写代码的有Cursor、Devin,它们都是非常好的智能体,可以在统一的平台下,端到端地解决某一类问题。
崔强:它们都是国外的产品,国内有没有一些比较成功的例子?
孙鑫:现在国内我还没有明确地看到哪一家 Agent 公司是比较好的,即可以提供现成的、比较好的Agent产品的公司,但确实有非常多好的 Agent Builder(智能体平台) 公司,可以提供工具集,让企业自建 Agent,这种公司是有不少的。
崔强:我读完那篇关于 “Agent Washing”的文章之后,第一感受是这个标准非常苛刻。根据这个标准,现在国内几乎找不到一家产品,或者只有为数不多的几个产品能被称为 AI Agent 的。为什么会用这样严苛的标准来定义呢?能否再向大家介绍一下这个标准。
孙鑫:首先是一个大的市场趋势。AI Agent之所以能够吸引大量资金投入,一定是构建了一个非常庞大的愿景,能力也一定要匹配得上。Gartner对于AI Agent 的定义是:一个自主或半自主的软件实体,它利用了人工智能的技术去感知、做出决策、采取行动,并且在数字和物理环境中实现企业或者个人的业务目标。
我把这些关键词再梳理一下:首先是一个自主或半自主的软件实体。如果它是一个半自主的形态,也不能说它不是Agent,在某些关键节点,它是可以把人类的角色纳入进来的,但最重要的一点是,它必须拥有自主决策的能力。
第二,它是一个软件实体,而非一个大模型。这个软件实体将 AI 组件放入其中,但最终的执行仍然是在软件层进行协调的,也就是说最终干活的仍然是该软件实体。
第三,提到使用 AI 技术,AI Agent,并不是必须且只有大语言模型才能被称为 AI Agent。大模型出现以前,已经有非常多的企业尝试用 Agent 方式去做一些工作,比如用更传统的机器学习,或者用符号 AI (symbolic AI) 的方式去做 Agent,使结果更可预知、更稳定,甚至通过代码来实现一些工作,这仍然是可以被称为 AI Agent。
AI Agent要用人工智能技术进行感知,获取外界信息,这种感知能力可能是目前技术上一个较大的瓶颈,因为外界环境很可能必须在统一的流程中,甚至在统一的云平台、大厂环境中,才能更好地协调。
第四,要做出决策, AI Agent 可能会调用不一样的功能制定行动计划,做出一些决策。 第五,采取行动,要把活给干了。我们要用 Agent 把一些工具、接口、技能和功能调用起来,对目标环境产生影响。
上面提到了一系列我们在定义AI Agent时的关键词,都是基于我们现在客户所提到的,或者说是客户对于AI Agent 的一个期待。目前的市场环境中,的确充斥着非常多炒作的声音,是很难实现这样一个愿景的。
目前国内市场能够被称为Agent 的软件实体是非常少的。企业可能更应当关注如何通过 Agent Builder Platform,构建符合自身需要的 Agent 。
崔强:刚才你提到,国内还是比较喜欢用自建的方式,而不是购买成熟的商业产品。而且国内成熟的 Agent 产品几乎也看不到。DeepSeek 这波AI 浪潮之后,是不是也为很多 CIO 或者企业提供了一种快速构建AI Agent的可能性?
孙鑫:DeepSeek 的出现,或者说很多国外大厂推出的开源模型,拉平了很多企业的差距,但对于一些头部甲方企业影响并不大,对于Tier Two(二级供应商),或者原来获得大模型非常困难的企业带来了新的可能性,但很多时候这也是需要企业自己去把握的。
企业可能更需要考虑的是如何让自己的数据能够与大模型真正产生协同效应,让大模型为自己所用。如果大家都是用同样的大模型,怎么才能凸显自身的差异性?作为一个供应商,如何通过大模型来实现自己的愿景,构筑自己的护城河,这是真正值得去思考的。
另外,现在我们非常巧夺天工地设计一些Workflow,通过 AI 工程搭建一些 Agent,在未来某一个时间点可能也会有问题。因为大模型的能力会向越来越多的丰富场景延伸,一方面它可以处理多模态数据了,另一方面它自己可能就会是一个工具,或者从一个大语言模型变成一个大行动模型。
这意味着,今天你可能做了非常多的Agent,但以后大模型稍微发力,就把这样一个能力直接取代了。
所以,我们要做的不是要等待一个新的大模型出现,而是应当考虑怎样结合自己的数据、企业的 Know-how,通过Reinforce learning(强化学习)实现一些新的功能,构筑属于自己的护城河,这一点非常重要。
崔强:确实是这样。这里有一个评论,好的 Agent 一定是有数据边界的,数据质量高度就是 Agent 的高度。这个观点你怎么看?
孙鑫:好的数据质量高度可能决定这个大模型本身的高度,因为现在企业已经基本上认识到:要做一个通用型 Agent 不太可能,更重要的是如何把 Agent 的边界划分清楚。比如做文档处理、数据获取、可视化等。边界的划分,以及如何在一个predefine(预定义)好的工作流下顺利完成工作,高效地实现企业的一些愿望,这才是一个 Agent 的边界感。
大多数企业要做的,很可能就是Multi-Agent(多智能体协同),单个Agent很难让客户产生一个很好的预期。当然你的数据越好,质量越高,这是一个非常好的底座。
崔强:刚才你提到DeepSeek的出现,为一些无法拥有头部企业预算的中小型企业,提供了一种构建 AI Agent的可能性,它们如何找到最佳的切入方式,你有什么样的建议呢?
孙鑫:虽然国内可以直接购买的、好的、现成的 Agent 产品非常少,但我们的建议是如果想要涉猎这一领域,可以先借鉴一些AI先行者们buy to build( 先购买再自建)的历程,或者尝试两条路并行的方式。
我们看到的最成功的试点项目,应该是着重展现业务潜力,而不是一种技术的可行性。企业在进行一些技术试点时,如果仅仅为了验证现有智能体的方式,在我们的系统或者说工作流中是可行的话,它为企业带来的只是微小的改进,反而会忽略这项技术可能带来的真正变革能力。
所以,我们不会建议企业现在一定要去做一个通用型的Agent,而是要先将一个你觉得可以让企业受益的,可以让业务潜力得以实现的点先做好,然后再去考虑多Agent的模式。
崔强:DeepSeek 为大家带来的焦虑是巨大的,几乎每个行业都要被 AI 重塑、改造了,聚焦企业软件或者 SaaS 领域,Agent 与 SaaS 或企业软件接下来的关系会是什么样子?我想听听你的看法,或者Gartner观察到的一些观点。
孙鑫:这个问题非常有意思。我们也经常讨论到,大模型和 Agent 厂商未来将是一种什么样的“相爱相杀”的关系。因为Agent 需要调用一些工具能力,这些工具能力可能是来自 SaaS 、传统软件。
从 SaaS 厂商角度,只要能把 SaaS 工具更好地用起来,能够产生用量,它也愿意被调用。但另一方面,大模型厂商也想干这个活,而且它们也是有能力构建这些工具的,这样就不需要通过MCP的方式去连接外界工具,相当于把原来 SaaS 厂商的工作都在大模型中实现,这就类似于大型云厂商跟 ISV 之间的关系了。
在国外,我们已经看到了类似的端倪,比如 OpenAI 的 Deep Research 并没有开放 API ,它希望用户打开 ChatGPT的界面,把大模型当做一个 Agent 来使用,而它将来就成为一个能够实现各种业务能力的平台。
对于前端 SaaS 厂商、工具型厂商来说,短期的做法可能会像 Salesforce 一样,结合自己的Know-how,在自己的平台中构建各种Agent。但未来,它们一定会考虑如何构建自己的大模型,让自己拥有一个“中枢大脑”,保持对客户有一个 AI 重力的吸引,这一点对于 SaaS 厂商也是非常重要的。
长期来看,SaaS 厂商、工具型厂商也会投入自己的模型建设,比如 Perplexity 在建自己的大模型。大家都会向用户侧更多发力,将过去的数据重力、平台重力逐渐向 AI 重力转移。
为什么要提“AI 重力”?我们过去经常讲数据重力,是指如果我能够把握企业数据,就有更多机会吸引企业在我的数据平台之上构建各种应用能力。比如企业买了一个厂商的数据库,就很可能在这个厂商的数据库上去买它的数据分析产品,包括搭建应用能力等。
AI 重力的吸引力,源于它带来了一个独特的 Agentic 体验,也会让很多的企业,由于 AI 能力,愿意购买更多平台上的工具和能力,所以,未来的争夺一定是在 AI 重力上。
在 AI 的技术发展上,东西方其实有非常不一样的评估标准。西方包括美国一些主流媒体,可能更关注大模型本身能力好不好,国内可能更注重的是日活、月活这样一些比较基本的指标。
在OpenAI CEO奥特曼的一些近期采访中,他也提到建最好的模型未必是最重要的,最有效的方式是有 10 亿日活在我的平台上。
最近,GPT 4o推出了一个图形渲染能力,可以让更多用户在平台上使用,就是利用了 AI 重力,让更多的用户使用,从而构建最坚固的护城河。AI 重力+用户使用,无疑是一个非常好的配套。
崔强:刚才你提到了大厂和 SaaS 之间的相爱相杀。这种相爱相杀的状态早期在大厂和 ISV 之间已经走过一轮了,现在可能会重现第二轮。未来,Salesforce等厂商和通用大模型厂商的关系会有什么变化?是不是也要自建 AI 生态圈,和生态中的 ISV 们一起成长。这一点到了 SaaS 或者 ISV 端会变成什么样子?
孙鑫:Salesforce、ServiceNow,它们对于自身领域都有着非常独到的经验,有自己独特的护城河。短期内,它们会推出各种GPT,今天是各种Agent。它们可能是在边界感上维持得最好的,现在只不过用一个更好的Agentic的界面,让用户有更好的体验。
对于这些厂商来讲,接下来一定会优先在数据层发力。比如 Salesforce 在最近的财报或电话财报会议中,都会反复强调自己 Data Cloud 的重要性。
这表明,数据才是Salesforce觉得真正重要的一个环节,它也一定会在自己的数据之上更好地训练出符合自己企业情境的模型。
Salesforce之所以能够做成这种平台式的 Agent 协同的方式,一方面是为了给用户提供更好的体验;另一方面,是为了让客户有更好的黏性,并且可以让客户看见未来使用 Salesforce 的一个场景或者一种可能性。
相比较而言,中国企业可能比较实在一些,不会在乎背后用的是什么模型,更注重实际价值,而不是在跑分上能够赢过你。
崔强:就是更务实、更落地一些。一个网友在问,Agent 怎么能够更好地处理端到端的问题?
孙鑫:以往的Agent ,更像一个全栈自研的过程,MCP 全新协议的出现,带来一个从全栈自研到协议组装的转变。很多中小企业可以通过MCP,将一些标准化零件进行Agent 的组装式搭建,虽然不能称之为端到端,但却是一种更省时、更合理,而且是在一个管理流程中搭建 Agent的过程。
此外,还有一种方式就是像ServiceNow、Salesforce 这类大厂推出的Agent,所有应用都是长在自身平台上的。
崔强:未来,很多 SaaS 公司,比如Salesforce这样的大平台,有没有可能也通过 MCP 调用平台外的能力。假设 ServiceNow 需要一个销售模块,是否也可以通过 MCP 协议来调用。而从客户侧来看,在解决某一个具体场景的过程中可能调用了很多来自不同平台、厂家的产品,有没有这种可能性?
孙鑫:这依赖于 MCP 协议的进一步发展。一方面要看这些大厂、 SaaS 厂商是不是会开放自己MCP 的服务;另一方面也要看客户是否真的需要。
假如一个中国客户从来没有使用过 Salesforce 的服务,他会选择去连接 Salesforce 的 Agent 吗?
此外,成本也是一个重要的因素。本来 10 块钱就能干的事,如果现在要花 15 块钱,要看客户愿不愿意花这个钱,这是个很现实的问题。对于很多企业来说,是否真的要通过搭建一个 Agent Swarm (多Agent框架)的形式来实现你的数字化野心?其实是没有必要的。
崔强:你讲得非常务实,不要追逐技术,花最少钱解决企业最核心的问题,才是最重要的。
说到连接和开放问题的,前两天我去了国内一家RPA + Agent 的公司,他们也提到MCP可以让大家连接起来,但问题是大家都不开放接口,所以只能用原来 RPA的那种方式,反而可能更切合实际一些。所以,又不能不考虑国内现有的情况。
另外,在客户侧,在自研和采购之间,国内客户对商业化产品接受度也不够,虽然这些年有改变,但本质上还没有变很多,你觉得最核心问题在哪里呢?
孙鑫:其实自研跟采购的讨论是持续存在的,国内的生态相对而言比较封闭。我们在国外会看到所谓的 Data Ecosystem(数据生态系统),或者Cloud Ecosystem(云生态系统),厂商与厂商之间各自赚各自的钱,由客户来选择,只要使用了你的产品,你就可以获得收益。
但国内厂商可能更愿意封闭地自我开发,而不是与别人对接,以至于很多厂商都说自己是做端到端生意。当然,这也是甲方的一个诉求,无可厚非。
从甲方视角来看,可以通过场景判断自研和采购的比例。如果是一个核心差异化的业务,自研的比例可能要高一点;如果是通用高频的需求,比如文档分类,完全可以通过采购的方式,自研比例可以非常低;这需要企业有一个头脑比较清醒的 AI 一号位,判断自己的场景适合自研还是采购。
崔强:前两天我们还开玩笑,有的老板说了要制定出未来三年的 AI 规划,但 AI 几乎是一周一个变化,规划一个月也许都显得有点长。在这方面,你可以给 CEO 哪些建议,比如说通过哪些KPI,来衡量CIO在这波 AI 里边贡献?
孙鑫:这方面我们一直有非常多的研究报告,这里我简单讲一个四层评估模型。第一层是效率层,即有 AI 和没 AI,到底会让企业的任务耗时降低多少?这是一种防御性的 KPI。
第二层,是质量层,这是一种比较进取型的 KPI 。以往我们总觉得大模型是会有幻觉的,或者不太能够符合企业的诉求,比如 Chat BI,它的决策准确率就非常值得审视。如何利用大模型,让它在做决策时能够符合企业预期,或者让准确率可被接受,质量层就非常重要。
第三层,是财务层,这是相对比较进取型的指标。比如过去做不到的事,现在因为DeepSeek和各种开源模型,我们可以开发出 AI 赋能的产品,从而为企业带来新的收益增长点,这是财务层的一个指标。
第四层,是安全指标,这是一个底线。可能过去很多企业没那么在意,但现在有非常多的 MCP 协议,由于还处于萌芽期,可能会存在非常多的安全隐患,如何能把潜在风险降到最低?或者说如何既能够保护企业最重要的数据资产,同时又能够利用好 AI 能力,这也是 CIO 需要关注的。
简单来讲就是效率、质量、财务和安全。
崔强:你们还写了一个构建 Agent 能力的“三步走”路线图。在这方面,会给大家一些什么建议呢?
孙鑫:我们确实有一个 AI Roadmap 的设计,但它并不是三个阶段那么简单。这里也可以简单说下这三个步骤:第一,先要去做一些能力试点,在试点的选择上,有些能力要放弃,有些事情不能做;如果一些试点成功的话,可以尝试在多个业务中做一些拓展。
第二,能力拓展。一些过去企业可能并不是很在乎的能力,现在可以附加到用户身上。企业中能不能构建出更多的 Prosumer ,开发出一些自己想要的应用,甚至是一些 Agent 的能力。
第三,是生态整合,怎样把我们 AI 赋能的产品融入大的业态当中,能够在一个大环境中为企业创造新的业务增收点。主要是这三个阶段的智能化跃升。
53AI,企业落地大模型首选服务商
产品:场景落地咨询+大模型应用平台+行业解决方案
承诺:免费场景POC验证,效果验证后签署服务协议。零风险落地应用大模型,已交付160+中大型企业
2025-05-07
CAG 与 RAG:哪种方法能带来性能更好的人工智能
2025-05-07
大模型与安全|第一弹:AI防口误指南之LLM输出安全实践
2025-05-07
从RAG到CoT再到MCP,一文读懂AI Agent落地难题|大模型研究
2025-05-07
蚂蚁集团基于 Ray 构建的分布式 AI Agent 框架
2025-05-07
AI编程模型领域迎新王?谷歌发布Gemini 2.5 Pro I/O,单条文本提示即可生成完整应用
2025-05-07
用AI把一段视频变成可视化网页,Google的新模型又卷飞了。
2025-05-07
忽视小模型和知识库,企业AI应用必将是死路一条
2025-05-07
探讨如何构建具有可扩展长时记忆AI Agents相关的技术实现
2024-08-13
2024-06-13
2024-08-21
2024-09-23
2024-07-31
2024-05-28
2024-08-04
2024-04-26
2024-07-09
2024-09-17
2025-05-07
2025-04-30
2025-04-29
2025-04-29
2025-04-29
2025-04-28
2025-04-28
2025-04-28