支持私有化部署
AI知识库

53AI知识库

学习大模型的前沿技术与行业应用场景


Data Agent如何化身“电子牛马”,深度懂你为企业解忧?

发布日期:2025-07-17 08:17:17 浏览次数: 1534
作者:场景定制化AI智能体

微信搜一搜,关注“场景定制化AI智能体”

推荐语

数据Agent如何成为企业的"数据秘书"?深度解析懂业务Agent的三大核心能力。

核心内容:
1. 懂业务Agent的三大层次:What、Why、How
2. 企业级数据Agent与通用型产品的关键差异
3. 实际应用场景:从零售业毛利计算看Agent的灵活决策价值

杨芳贤
53AI创始人/腾讯云(TVP)最具价值专家

数据 Agent:企业的新“救星”还是“助手”?

当下,Agent 产品正炙手可热,但真正能够深刻理解企业需求、辅助决策的却并不多见。许多企业手握海量业务数据,却苦于无法高效利用。那么,数据 Agent 能否成为解决这一难题的“救星”?

为此,我们特地邀请了数势科技的联合创始人谭李和飞轮科技的联合创始人肖康,共同探讨“懂业务”的 Agent、Agent 与传统 BI 的差异、Agent 如何参与决策,以及它们未来在企业中的角色定位。

对话亮点

  • 商品毛利,指标各异
    :即使是简单的商品毛利指标,不同企业的计算方法也大相径庭。一个懂业务的 Agent,必须首先明确其背后的具体指标组合。
  • 数据分析新趋势
    :数据分析正在从“用户直接操作”向“为 Agent 服务”转变,Data Agent 提高了人与数据系统的互动频率和效率。
  • 灵活决策是关键
    :Data Agent 适合的应用场景众多,但共同特点是需要灵活、及时的决策支持。

“懂业务”的 Agent:不只是工具,更是数据秘书

量子位:数势科技,你们是如何理解“懂业务”的 Agent的?能否用几个关键词或能力指标来概括?

数势科技谭李:懂业务的 Agent,就像是你多年的秘书,非常了解你。你刚表达需求,它就能推断出你的目标,并进行分析和执行。相比之下,不懂业务的 Agent 则像刚来的外包人员,虽然具备通用能力,但对业务语境和知识缺乏基本理解。

我们将“懂”拆解为三个层次:第一是“我知道是什么”(What),即对业务概念的理解;第二是“我知道为什么”(Why),能理解背后的逻辑;第三是“我知道怎么办”(How),能提出实际操作建议。一个懂业务的 Agent 应该能在这三方面与使用者形成良好互动。

以我们服务的大型零售客户为例,即使是“商品毛利”这个通用指标,每家企业的计算方法也不同。一个懂业务的 Agent,首先要明确其背后到底包含哪些指标。

量子位:现在很多通用型 Agent 也自称是秘书或工作伙伴,那企业级数据 Agent 的定位和价值具体在哪里?

数势科技谭李:我们可以从两个维度划分 Agent:通用 vs 垂直、企业级 vs 非企业级。我们的产品属于“垂直 + 企业级”,专注于数据领域。

我们的产品主要面向企业内部的业务人员和分析师,因此“懂业务”尤为重要。我们不是简单调用大模型,而是构建企业私域知识,让每个企业可以配置或导入自己的知识体系,并让产品进行学习和迭代。

它的使用场景是在企业做业务决策时,提供分析支持,让业务人员或分析师在私域的语义环境下,以更高效的方式获取数据与洞见,支持业务决策。

量子位:从数据库的角度来看,飞轮科技认为一个“懂业务”的 Agent 在数据处理上应该具备哪些能力?数据库发挥了怎样的作用?

飞轮科技肖康:我们理解的“懂业务” Agent 与通用型最大的区别在于它理解的是“有语义的数据”,而非裸数据。现在很多人尝试用大模型进行 Text-to-SQL 查询,效果并不好,因为数据不准确,还需要人工校验,增加了成本,甚至可能误导决策。

关键在于缺少了“语义层”。理想的方式是让自然语言首先映射到已经建模、贴合业务语义的指标数据中,比如指标平台中的数据。以商品毛利为例,不同企业的定义不同,如果跳过语义层直接查数据库,很容易出错。因此,有语义的指标平台是关键,它是让 Agent 真正“懂业务”的基础。

企业级 Agent 如何模拟人类分析师?

量子位:现在企业级 Agent 是如何模拟人类分析师的?在提问和归因逻辑上有没有特别的处理方法?

数势科技谭李:我们前面把 Data Agent 比作“跟了你多年的数据秘书”,我再举个例子:它就像企业为每个业务人员配备的“电子牛马”。以前,数据分析主要依赖“表哥表姐”手动处理,可能2个分析师要支持4、5个业务部门,还需要足够了解业务团队。

而现在,分析师“饲养”一群数据 Agent,让它们替代自己完成重复劳动,打破了人力的瓶颈。通过 Data Agent 实现了“人人用数”,带来了数据生产和数据消费上的根本性变革。

我们从2023年就开始提倡 NLP-to-Semantic 路径,即通过自然语言映射到语义层,再由语义层连接底层复杂的数据逻辑。这些语义层建立在企业内部分析师的指标体系与业务逻辑之上,更贴合企业实际。

量子位:在飞轮科技打造懂业务的 Agent 时,底层数据库做了哪些工作?比如为了实现跨表处理等功能,数据库有什么特别之处?

飞轮科技肖康:AI 时代对分析型数据库的需求越来越高。比如 BI 查询,过去是数据工程师写程序、拉报表,现在用户可以直接用自然语言跟系统对话,背后其实是 Agent 在替用户发起查询。未来,Agent 甚至会替人做大部分决策和分析。

分析从“用户直接操作”正在转向“为 Agent 服务”。虽然现在 Agent 还没那么多,但未来它们的数量可能是人的十倍、百倍,且不会“休息”,每几分钟就查询一次。这对数据库提出了三个挑战:

  1. 高并发和高频访问
    :Agent 是程序,要求响应快、并发高,几千甚至上万并发去做查询是常态。
  2. 更强的实时性
    :过去数据延迟可以是小时、分钟,现在要做到上一秒用户产生数据,下一秒就能分析。
  3. 数据类型更多样
    :不仅是结构化数据,企业内部的文档、用户评论等非结构化数据也要参与分析。

我们做了各种索引优化,不断提升 CPU 资源利用效率,还专门设计了面向半结构化、非结构化数据的架构,和对象存储等系统打通,支撑 AI 任务里的多源数据分析。

个性化、主动式 Agent 正在取代传统 BI

量子位:传统企业使用报表或传统 BI 进行数据分析,那么从产品能力看,Agent+Data 与传统 BI+大模型的最大差异在哪里?

数势科技谭李:这可以概括为两种路径:Data Agent 路径和 Chat 与 BI 路径。核心差异有三点:

  1. 个性化
    :Data Agent 更具个性化。在 BI 报表基础上叠加大模型,用户可以通过 Chat 查询数据,解决了灵活性问题,但仍然是基于报表内容本身,不是为某个具体用户量身定制的。而智能代理 Agent 就像个人数据秘书,能理解你的分析习惯。当两位员工同时问“帮我看一下过去一个月的业绩情况,KPI 达标了吗”时,他们看到的内容可能不同,因为部门、KPI、目标值都不同。这是传统 BI 难以解决的,而 Data Agent 能理解你个性化的语境与背景,提供真正专属的分析支持。
  2. 主动性
    :传统的 Chat BI 是“我问你答”,有时答不出来或数据不完整,本质上是被动的,用户需要有明确问题意识,门槛很高。而 Data Agent 是主动式的,能根据设定推送数据、发出预警,自动生成报告。比如在老板早上进办公室前,Data Agent 就已将关键数据整理好放在他桌面上。Data Agent 是一个主动汇报、主动发现问题的智能秘书,范式完全不同。
  3. 更强大
    :Agent 不只是信息查询工具,还能主动执行一系列操作。比如我们有一个大型零售连锁客户,全国有几千家门店,他们通过 Agent 分析门店经营数据后,可以自动判断出哪些门店存在问题,并触发任务系统,直接将具体改进任务下发给店长或店员,这些任务需在一周内根据公司 SOP 要求完成。这种决策-执行联动的能力是传统 BI 无法实现的。因此,Data Agent 相较 Chat BI 更个性化、更主动、更强大。

量子位:很多企业认为传统 BI 工具没有充分激活沉淀下来的数据资源,即“沉睡的数据金矿”。那 Agent 是怎么让这些数据真正“活”起来的?

数势科技谭李:这是个应用侧的问题。Agent 有着主动性、个性化等特征,而传统 BI 模式中,数据的使用是被动的。业务人员需要先提出具体问题或需求,分析师才会从数据沼泽中挖掘数据来满足这些需求。这意味着分析师和业务人员都必须非常清晰地知道他们要什么,才能推动整个过程。

在 Data Agent 模式下,我们通过后台 7×24 小时持续运行,配置各种分析范式和模板,然后由系统根据业务角色的差异主动推送分析报告和预警。它不断扫描数据、提炼洞察,并以适当形式交付给业务人员,相当于增加了一种数据消费的场景,让原来被忽略的数据能被挑出来、活过来,背后的业务问题和逻辑被阐释出来。

这样原本被忽略的“沉睡数据”就被激活了。

我还想强调一个未来趋势:企业员工会成为“超级个体”,拥有多个 AI 工具的支持,比如除了数据 Agent,还有写 PPT 的 Agent、作图的 Agent 等。一旦每个人都有一个数据秘书,数据消费将被普惠化。

过去的数据沉睡,不是因为没有人需要,而是因为需求被集中管制在分析师和 BI 报表的通道里。而现在通道打开后,海量业务人员的需求可以直接触达数据,通过 Agent 进行消费,这是一种更加普惠、灵活、广泛的数据使用方式。

量子位:数据库在这方面有哪些实践或支持方式?

飞轮科技肖康:数据库可能本身做的并不多,更多是作为支撑平台。但我也谈一下我的看法。

过去通过传统 BI 或表格获取数据,很多业务需求其实是被压抑的,本质上是由效率决定的。比如一个业务人员可能都不知道数据库里有什么数据,只有数据工程师或分析师知道,而分析师的时间和精力有限,所以业务人员不会频繁提问。

如果能配备一个 Data Agent,业务人员就可以随时提出需求,让 Agent 自动探索数据库中可用的数据,再结合大模型和企业内部知识完成任务。更重要的是,它还能展示分析过程,让你理解答案是如何得出的,便于验证逻辑。这种多轮迭代机制极大提升了效率。

本质上,这种变革提升了人与数据系统的交互频率与效率。以往中间有分析师“把关”,现在则是直接与系统对话,这也对数据库提出了新的挑战,比如系统需要支持更高的查询频率和更大的查询量。以前只有“表哥表姐”使用,现在是全公司的人都在用,且查询往往集中在高峰期,比如上班时间。

所以数据库需要具备弹性伸缩的能力,峰值时能扩展更多计算资源,低谷时则能节省资源,避免企业为不必要的峰值付费。像我们 SelectDB 就在云端提供弹性服务,以支持 AI 应用的高并发需求。

量子位:在业务场景中,哪些场景最能体现数据 Agent 的价值?这些场景有没有共通特征?

数势科技谭李:随着我们服务的客户越来越多,接触到的业务场景也不断丰富,我们发现其实360行中,大家在原有数据消费范式中都有很多痛点和问题。可应用的场景很多,但共同特征是灵活、及时的决策。

大型企业已有各种指标和 BI 报表支撑日常分析,区别只是分析师能力的强弱。但使用 Data Agent 的最大不同在于它不是依赖固定、静态的报表,而是在动态业务场景中提供实时支持决策的能力。

比如今天你需要做一个业务决策,不想拍脑袋、不靠直觉,而是希望有数据支持。这个时候,如果能通过自然语言即时向系统提问并获得答案,那这个场景就极具价值。

我举一个身边的例子。比如在零售行业,有一个典型角色叫“督导”,特别是大型加盟连锁企业中。督导每天要巡店,拜访多家直营或加盟门店,一人通常负责几十家。对任何人来说,记住这么多门店的信息几乎不可能。而且督导虽然执行力强,但并不一定擅长文字处理或数据分析。

他们经常面对的场景是:今天要拜访五家门店,却常常在前往门店的路上才有时间临时了解店铺的经营情况,比如上个月的业绩、SOP 是否预警、上次提出了哪些改进建议、这次要重点检查哪些方面。两个门店之间的通勤时间可能也就半小时,这种临时了解非常困难。

所以,我们为每个督导配备了 Data Agent。督导可以对即将拜访的门店随时提问,如“这家店上月销售是否异常”“员工离职率有没有异常”等,Agent 会即时反馈,不再需要前一天做资料准备或打印报表。

这个云端小助手也叫“百事通”,让督导从走马观花式巡店,变成真正数据驱动、精益化的单店运营模式。对他们来说,这是极大的效率提升,也是让精益化单店运营真正落地的一个关键杠杆。我认为这是一个非常具有代表性的“灵活、及时决策”的典型场景。

量子位:数据在什么样的场景中特别能够体现其价值?这些场景是否也有共通特征?

飞轮科技肖康:从我们与客户的实际交流来看,数据在“垂直类场景”中更容易展现价值,尤其是企业对自己的业务理解非常深,能够用 AI 来重构现有业务流程的公司。

比如有些企业专注于营销、反欺诈、或客服领域。他们本身就有成熟的业务模型,再通过 AI + Agent 的方式进行重构,能看到非常明显的提升。相比之下,那些尝试做通用型 Agent 的探索往往效果就不如预期。

而且在做垂直领域的应用时,还可以用传统的高人力成本的方法来对比验证,评估 AI 方法是否有效。

所以我们看到,最有效的应用往往是那些在本领域已有深厚经验的公司,再用 AI 工具强化业务,并且能被清晰评估的场景。这类垂类 Agent 的推广和落地更有效,也更容易验证成效。

在私域数据加持下,员工正被 AI Agent 增强

量子位:企业如何判断一个 Agent 的数据决策是“合理的”或“成功的”?有没有明确的评估标准?

数势科技谭李:我们一直强调数据是用来支撑决策的。决策场景可以分为两类:一类是封闭场景,决策规则非常清晰,比如积分规则:刷满五笔,第五笔给予双倍积分。这种场景的规则明确,Data Agent 可以很好地支持决策,衡量标准也很清晰。

另一类是“开放场景”,决策涉及的因素非常多,特别是偏宏观的业务决策,需要考虑的内外部要素也更多。此时,我们的理念是,Agent 不是替你做决策,而是提供决策支持和辅助。我们努力将更多的数据呈现出来,帮助业务人员在更充足的信息背景下做出更科学的决策。

在很多企业里,业务决策常常因为数据没有那么多,或者有时效性,容易变成拍脑袋的决策或惯性决策,或者让经验最丰富的人决定。但我们认为,好的数据支撑能显著提升决策的质量。

在封闭场景下,Data Agent 已能很好地支持基于规则的自动决策,甚至贯穿到执行层。而在开放场景中,产品的核心逻辑就是“懂业务”。Data Agent 会从业务语境出发,结合内部数据与接入的外部权威数据,比如打通 Web 搜索,形成一个结构化的分析报告。就像一个称职的秘书,搜集齐所有资料,最终由业务决策者来做决定。

量子位:作为数据库,有没有办法判断 Agent 是否充分利用了数据?比如判断数据是否缺失、错误、冲突,或者评估数据的可靠性?

飞轮科技肖康:数据库作为底层支撑系统,本身不理解语义,职责主要是高效地组织和查询数据。比如数据库作为中央存储,整合了 SQL 网关、ES 数据等多个来源,有时还包括文档数据。

数据库可以辅助评估哪些数据被频繁访问,哪些使用较少,初步反映数据的使用价值。但判断数据是否被“充分使用”以及使用是否“合理”,更多还要靠上层来评估。

数据库层面也可以提供技术支持,比如通过慢查询日志判断是否缺乏索引、是否使用了低效查询方式等。我们也在探索如何用更智能的方式帮助用户更高效地使用数据库。

量子位:在决策中往往涉及敏感或关键数据,有什么方法可以在保证数据调用灵活的同时保障数据安全?

飞轮科技肖康:这就需要做好细致的数据权限控制。常见的做法是基于角色(RBAC)进行权限设定,比如 CEO、一线员工、部门负责人拥有不同访问权限。我们可以控制用户能访问哪些表、哪些字段,甚至可以精确到表格的某一行或某个单元格。

在像 SelectDB 和 Doris 这样的系统中,这些都可以通过细粒度的权限控制表达出来。尤其在 AI 和 Agent 时代,这种安全控制非常关键。以往数据由少数人集中审批,甚至需要邮件申请来获得数据权限。现在用户可能只需跟 AI 聊天就能获取数据。如果权限控制不到位,很容易造成数据泄露风险。

我们认为对安全能力的要求,越控制到底层会越好。

量子位:数据 Agent 是否能在某些环节完全替代人?

数势科技谭李:目前谈“完全替代人”还为时过早。关于大模型和 Agent 是否会替代人,其实我们更倾向于认为它是在“增强人”。确实,Data Agent 会替代一部分重复性强、基于规则的任务,但会增强另一部分人的能力。越早拥抱 Data Agent 的人,就越可能成为“被增强的人”。

在封闭场景中,很多基于清晰规则的日常决策,完全可以由 Data Agent 自动化完成。这其实不等于“替代人”,而是把重复、低价值的工作交给 Agent,人可以去做更重要的事。所以这涉及两个层面:一是哪些决策可以由 Agent 自动化执行;二是 Data Agent 的引入会替代哪些人,又增强哪些人。

量子位:这会对未来企业组织结构会带来怎样的影响?

数势科技谭李:最近我们也在思考这个问题。比如现在硅谷流行“超级个体”或“一人公司”的概念,本质是各种 AI 工具扩展了个体的能力。

过去可能需要团队完成的数据分析、报告生成、设计任务,现在一个人就能搞定。比如用 Coding Agent 搭建网站、用 Data Agent 管账户、出报表,甚至用 Design Agent 做视觉设计。

这确实催生了“超级个体”,让他们可以身兼多职。但这并不意味着数据分析师或设计师这些角色会消失。在大组织里,他们仍然需要。只是角色发生了变化。比如原来是“表哥表姐”的人,现在成了“电子牛马饲养员”——一个高级分析师,管理成百上千个 Agent,为各个业务线服务。

这时候对你提出的要求就更高了。你需要做的是维护企业的数据质量和数据语义,要联合财务、销售、商品等部门共创分析范式,并沉淀为 Agent 模板。

这些全新的任务在传统范式下并不存在。所以并不是工作减少了,而是出现了新工作。只要你愿意拥抱大模型和 Agent,就能成为这种新范式下的核心角色,创造更大价值。这是我对未来的一个畅想。

量子位:随着模型和数据技术的提升,数据和 AI 的关系也在变化。未来企业的智能化发展会更依赖更强的模型,还是更好的数据?

数势科技谭李:我觉得这其实是一体两面的——既要更好的数据,也要更强的模型。我们目前在做企业级 Data Agent 时,是暂不涉及基础模型的研发的。我们更关注的是如何把更强的基础模型与企业的私域数据结合起来,打造更聪明、更能干的 Data Agent 或企业级智能体。

我们可以看到,现在底座模型在不断迭代,更多企业级应用在诞生,企业也越来越重视私域数据的积累与治理。这样几件事的叠加作用下,飞轮正在转动起来。未来我们将看到越来越多真正落地、有实际价值的 Data Agent 或更多应用在企业场景中发挥作用。

飞轮科技肖康:我认为,模型要发展,首先必须有更好的数据。数据是模型的基础。大模型的显著提升,从 GPT-3 开始就是一个很好的例子。GPT-1 和 GPT-2 出现时并没有引起太多关注,因为它们训练所用的数据量和质量还不够,而到了 GPT-3,训练数据的数量级提升了好几个层次,才带来了质变。

这是第一个阶段,训练阶段,大量高质量数据决定了模型的能力。第二阶段是落地应用阶段,也就是谭总提到的,大部分企业并不会再去自己训练模型,而是基于已有的大模型进行应用。无论是开源模型的私有部署,还是调用已有模型的服务接口,关键在于如何将企业自己的数据与模型结合。

完成了第一阶段的大模型就像是刚毕业的大学生,拥有通用能力,但对企业的业务流程、数据结构一无所知,需要一定时间去适应、学习。这时候企业的私域数据非常关键。我们通常分为两类数据:一类是文本知识库,来源于企业内部的文档、资料,用来做知识问答;另一类是结构化数据,也就是数据库或数仓中的业务数据。

所以,我认为训练阶段需要大量的高质量数据,企业落地应用阶段,也需要把企业私域数据的优势发挥出来。企业只有用好自己积累的数据,才能真正让 AI 发挥作用,否则无论模型多强,部署也只是形式,和开源模型没本质区别。

量子位:最后两位嘉宾还有什么想要补充分享的?

数势科技谭李:无论是我们今天聊的 Data + AI,还是其他 AI 应用场景的落地,现在都在如火如荼地推进中。作为从业者,每天都很兴奋。

第一点,我想强调心态:我们应该积极拥抱 AI。正如我们之前所说,AI agent 会替代一部分人,也会增强一部分人。我们应该努力成为被增强的那部分。

第二点,对企业来说,最关键的事情是两件:一是把企业内部的私域数据、语义系统真正治理好,才能驱动 AI 飞轮转起来;二是与业务结合,深入挖掘适合落地的 use case,让技术与业务价值真正融合。

飞轮科技肖康:我觉得谭总说得很好。我想强调一点:AI 落地的过程,一定是一个不断探索、不断试错的过程。虽然现在大家都很兴奋,认为这是 AI 的新时代,但真正落地还需要大量实践,去找到突破点。

在这个过程中,我认为业务和平台的联合共建非常重要。业务方了解业务流程和价值,平台方提供底层技术支持,包括数据库、AI Agent 能力等。只有双方不断交流互动,平台才能更精准地满足业务需求,技术能力也才能不断增强。

因此也欢迎大家多与像数势、SelectDB 这样的数据平台、数据库公司多交流合作,一起把 AI 探索落地,在企业中真正用起来!



53AI,企业落地大模型首选服务商

产品:场景落地咨询+大模型应用平台+行业解决方案

承诺:免费场景POC验证,效果验证后签署服务协议。零风险落地应用大模型,已交付160+中大型企业

联系我们

售前咨询
186 6662 7370
预约演示
185 8882 0121

微信扫码

添加专属顾问

回到顶部

加载中...

扫码咨询