免费POC, 零成本试错
AI知识库

53AI知识库

学习大模型的前沿技术与行业应用场景


我要投稿

基于多智能体的ChatBI在商业银行的应用研究

发布日期:2025-11-27 18:42:55 浏览次数: 1526
作者:中国信用卡

微信搜一搜,关注“中国信用卡”

推荐语

商业银行如何借助多智能体ChatBI实现金融服务升级?这项技术正重塑金融行业的智能决策体系。

核心内容:
1. 多智能体ChatBI系统的三大发展阶段与技术突破
2. 分布式协同机制如何解决传统BI系统的效率与准确性痛点
3. 商业银行应用场景与未来普惠金融发展方向

杨芳贤
53AI创始人/腾讯云(TVP)最具价值专家



作者

华夏银行 龚伟华 王彦博 汪秀山 魏文术 李娜

龙盈智达(北京)科技有限公司 唐晓虎






2025年全国两会《政府工作报告》中明确提出“持续推进‘人工智能+’行动”及“支持大模型广泛应用”。基于多智能体的ChatBI系统凭借分布式协作特性、专业化角色分工与自适应交互机制,可将复杂的商业银行相关任务拆解为多智能体的协同目标,各专项智能体依托自身专业能力,在遵循金融合规要求的前提下实现高效协作,既发挥单一智能体的专业化优势,又通过多智能体的分工、协作提升系统对复杂场景的适配能力。据此,商业银行以多智能体ChatBI应用推动金融服务向更精准、更高效、更普惠的方向持续发展。






一、大模型ChatBI技术发展历程




大模型、智能体与商业智能(BI)的融合演进,推动着数据智能迈向规模化发展。这一技术融合通过三个阶段的递进式发展,不仅体现了数据智能技术的持续完善,更标志着BI系统在功能边界、处理复杂度与应用灵活性方面的跨越式提升。


1.接入大模型能力的ChatBI系统(2022—2023年)


这一阶段的ChatBI系统基于大语言模型(LLM)能力,通过自然语言问答实现数据查询和分析,交互方式开始变得灵活易用,但大模型直接生成结构化查询语言(SQL)的方式仍然存在较多问题,例如,业务术语与数据库Schema的映射偏差导致生成SQL准确率低,大模型直接生成SQL未经优化易引发性能瓶颈等,因此此类技术的准确率和执行效率都有待提升。


2.以单智能体为核心的ChatBI系统(2023—2024年)


在这一阶段,智能体的构建引入记忆、工具调用、规划等模块,使BI系统获得一定的自主性,可以处理多轮会话以及使用简单工具,但单一智能体在处理复杂任务时,其专业能力存在固有的边界约束,难以兼顾多领域知识深度与跨场景适配广度,易出现准确度下降或响应效率不足等情况,在执行任务时由于缺少并发处理机制,存在执行效率低的问题。


3.以多智能体为核心的ChatBI系统(2024年至今)


多智能体ChatBI系统通过分布式协同机制实现商业智能任务的高效拆解与执行,主Agent作为全局协调中枢,可解析用户意图、识别问题类型,对任务进行拆解与分发,对任务优先级、子Agent专业能力、可用资源进行全局感知,并优化多Agents的协同效率,同时通过结果评估与动态反思机制实现系统闭环优化。这种协同范式有效突破了单一智能体在专业能力边界、复杂场景适配性上的固有局限,通过核心中枢的全局调控与子Agent的专业分工,显著提升了系统对复杂商业智能任务的处理能力与鲁棒性。




二、多智能体ChatBI技术框架




在商业智能任务场景中,多智能体协同机制的构建能够保证任务的高效执行及结果的稳定输出。以主Agent为全局协调核心,通过任务调度将各专项子Agent有机整合,形成“总分联动”的智能决策与执行体系,通过层级化的任务拆解、专业化的任务分工以及闭环管控,突破了单智能体在复杂场景处理上的局限。


本文提出多智能体ChatBI系统“5C”框架(如图1所示),涵盖主Agent——中控智能体(Central AI Agent),以及子Agent——商业智能智能体(Chat BI Agent)、因果分析智能体(Causality Analysis Agent)、结论智能体(Conclusion Agent)以及代码生成智能体(Code Generation Agent)。




1. 各智能体功能定位


(1)中控智能体


中控智能体的首要功能是规划,负责理解用户的意图并进行任务拆解、总体调度和信息流控制,支持多路并行推理,是系统的核心控制器;另一功能是评估,负责对前序分析结果进行评估,具备反思与自我评估能力,实现链路的动态调整和优化。


(2)商业智能智能体


商业智能智能体负责商业智能任务,配备丰富的商业智能工具箱,专注于数据的深度解析与运算,凭借专业化的数据处理逻辑与算法适配能力,成为支撑商业智能全流程的“数据智能专家”角色。


(3)因果分析智能体


因果分析智能体负责数据指标下钻与指标根因分析,支持对指标变化和业务码值的精细解释,通过构建多层级指标关联网络与业务语义映射模型,实现从指标变化到根因要素的穿透式推理。


(4)结论智能体


结论智能体作为商业智能分析结论的输出环节,负责对其他智能体的分析处理过程与结果进行系统性归纳总结,形成兼具逻辑性与完整性的总结性应答;为全系统的语言交互任务提供基础性支撑,确保人机交互以及智能体间协作的流畅性与一致性,同时提升复杂分析成果的传递效率与可理解性。


(5)代码生成智能体


代码生成智能体具备代码生成与执行的专业化能力,在应对可定制化的商业智能任务时,通过程序化脚本的自动化运行实现高效处理。在常规分析场景中,商业智能智能体可依托预设逻辑完成标准化指标计算与可视化输出,而当面临复杂数据转换、自定义算法实现等场景时,代码生成智能体则可对商业智能智能体的输出结果进行二次加工。


多智能体ChatBI系统工作流程如图2所示。



2. 多智能体ChatBI系统技术特点


(1)高效协同调度


中控智能体作为全局协同中枢,负责统筹各功能智能体的任务调度与协作流向管控。通过构建“主Agent—子Agent”的层级化交互模式,确保各子Agent在统一的任务目标与时序逻辑下实现高效协同,保障系统在复杂商业智能分析场景中的稳健运行与流程可控。


(2)自适应推理流程


中控智能体作为中枢决策单元,具备对任务类型与输出结果的智能研判能力,针对简单查询类任务,通过轻量化推理链路实现即时响应;面对复杂分析类任务,则启动多步骤深度推理的“慢思考”机制,确保结论的全面性与精准度;同时,内置“评估功能”模块,基于输出结果进行自动化核验,若识别到潜在偏差,则触发任务重新执行流程。多智能体ChatBI系统运行流程如图3所示。





三、多智能体ChatBI系统核心能力




多智能体ChatBI系统主要具备“4R”核心能力:一是推理与规划(Reasoning&Planning)能力,支撑对复杂任务的拆解与逻辑推理;二是协调与合作(Reconciling&Collaboration)能力,以专业化分工与交互实现群体智慧的高效应用;三是记忆与回忆(Remembering&Memory)能力,负责对任务上下文与历史交互信息的存储与动态调用;四是反思与自我评估(Reflection&Self-assessment)能力,保障任务执行的实时纠错以及结果的稳定可靠。


1. 推理与规划


在单智能体系统中,所有任务均由单一智能体自主执行,这种设计虽然具备基础泛化能力,但在应用深度上存在明显局限,其知识的覆盖范围受限于初始训练数据集,难以应对金融领域出现的复杂商业智能场景,当系统需要适应新的业务场景需求时,通常需要进行全量模型迭代更新,存在时效性缺陷。


相较而言,多智能体系统通过模块化设计实现了能力的专业化分工,每个子Agent经定向训练后成为特定领域的专家节点,由主Agent根据任务特征进行推理与规划,动态调用最优执行单元。这种系统具有双重优势,既保障了各专业领域内的处理精度,又通过标准化接口实现了系统的弹性扩展能力,该特性能够有效应对业务场景的多样性需求。


2. 协调与合作


协调与合作的核心目标是实现跨领域专家系统的协同决策与执行,通过信息交换与任务协调完成复杂问题的分布式求解。这种协作模式类似于对某一类疾病的多学科专家会诊,其中包含大量的协调工作,比如对一个问题进行初步分析后,召集什么样的专家、如何让每个专家都发挥出自己的特长、如何引导这些专家达成共识,这些都是多Agents协作机制涉及的领域,系统需要动态调用多个具备不同专项能力的子Agent进行问题分类执行及结果汇总。


3. 记忆与回忆


记忆与回忆作为多智能体交互的核心支撑模块,由短期记忆与长期记忆两个子模块构成,其核心功能在于实现对话上下文的动态延续与知识经验的沉淀,为智能体的决策推理提供持续的语境支撑与历史经验参考。系统的设计聚焦记忆存储与记忆检索两大关键环节。


(1)记忆存储


系统突破了基础智能体仅能存储自然语言会话的局限,针对商业智能场景中用户对结构化数据分析结果的高频需求,构建了多模态记忆存储架构。该架构不仅涵盖自然语言会话文本,还将结构化数据(如分析报表、指标计算结果、表格型输出)及交互上下文元信息(如查询时间、任务类型)纳入记忆范畴,实现从单一文本记忆向“文本—结构化数据—上下文元信息”多模态记忆的演进。


(2)记忆检索


通过构建多层级索引体系与智能化检索机制,系统实现了记忆资源的精准调用,可对记忆系统中的多模态内容进行深度索引:针对文本类记忆,构建基于关键字词与向量的索引;针对结构化数据类记忆,构建基于字段特征的索引;针对时序性交互类记忆,建立会话时序索引,形成“语义—特征—时序”三维索引网络,为高效检索奠定基础。


通过构建记忆系统并利用多模态存储扩展记忆的信息维度,凭借多层级索引及智能化检索技术提升记忆调用的精准度与效率,最终为复杂场景应用提供了可靠的语境支撑,有效提升系统的响应准确性与用户交互体验。


4. 反思与自我评估


反思与自我评估机制是系统实现闭环优化的关键组成部分。该机制旨在对系统行为进行量化评估,并通过动态纠错、自主迭代和持续优化来提高决策的可靠性和适应性。由于大语言模型是一个概率模型,表达一个意思会存在多种说法,所以评估其对错并不容易。评估的原则是准和快,希望能够用自动化评估的方法又准又快地完成对答案的评估。


(1)确定性任务评估法


该方法基于精确匹配原则,适用于可量化且无歧义的任务场景(如选择题、填空题等),在问答系统的数据查询验证中表现突出,通过比对模型输出与基准值即可计算准确率。其优势是便于大规模数据采集且生成的成本较低,在参数微调阶段能够提供稳定的监督信号。


(2)基于人类反馈的奖励建模评估法


该方法通过人工打分来判断对错或者好坏,再通过奖励函数的学习来模仿人类打分的原则,最终通过奖励函数对结果进行打分,就像训练一个机器人模仿老师给学生批作业。该方法具有较高的灵活性和权威性,但是依赖于人工打分样本的数量和奖励函数的质量,因此需要专门训练一个打分模型,从而对一些比较灵活的问题进行严格的评判。


(3)分布式投票评估法


使用投票(Voting)机制对问题的结果进行评判,这种做法的优势是不需要找一个非常厉害的个体来做裁判,在实际操作中,往往让大模型独立进行多次推理进而产生多个答案,并通过投票来选择最终的结果。




四、核心能力应用示例




1.推理与规划及协调与合作


本文以零售金融业务中“各分行零售AUM规模比上月增速超过3%的有哪几家?”这一问题为例,分析单智能体系统与多智能体系统在处理逻辑上的差异。


(1)以单智能体系统为例


单智能体系统需独立完成从问题理解到结果输出的全流程,其核心路径如下。


一是问题解析。单智能体系统通过自然语言处理(NLP)解析用户意图,识别核心要素——“各分行”(维度)、“零售AUM规模”(指标)、“比上月增速”(计算逻辑:(本月值-上月值)/上月值)、“超过3%”(筛选条件)。


二是数据提取与计算。系统生成SQL查询语句提取各分行的本月和上月零售AUM数据,执行增速计算:增速=(本月AUM-上月AUM)/上月AUM×100%。


三是结果筛选与校验。系统筛选出增速大于3%的分行,同时检查数据完整性(如是否存在某分行上月数据缺失的情况)、计算逻辑正确性(如是否混淆“环比”与“同比”),最终返回结果。


单智能体系统存在的局限性主要在于需同时具备自然语言处理、数据查询、数学计算、逻辑校验等多种能力,若某一环节薄弱(如对“环比增速”的计算逻辑理解偏差),会导致整体结果错误。


(2)以多智能体系统为例


多智能体系统通过“中控智能体统筹+子Agent专业化分工”实现任务拆解,其运行逻辑为:总任务—子任务A(问题解析)—子任务B(数据提取)—子任务C(增速计算)—子任务D(结果筛选)—子任务E(结果校验)。


涉及的智能体及其角色如下:中控智能体——全局调度中枢,负责任务拆解、子Agent分配、流程监控。其中,子Agent中的商业智能智能体——专注于商业智能任务,提取关键要素(维度、指标、计算逻辑、筛选条件等),在本示例中查询本月、上月零售AUM数据;代码生成智能体——专注于编写代码进行数学逻辑执行,基于公式计算环比增速,确保计算精度;中控智能体——校验结果合理性,包括指标定义一致性(如各分行零售AUM是否均包含理财、储蓄等科目)以及计算逻辑正确性(如是否误用本月数据作为分母等)。


2. 记忆与回忆


本文以多轮会话为例展示多智能体ChatBI记忆系统运作机制。


(1)第一轮会话


用户输入“请展示各分行2024年10月零售AUM的环比增速”;系统响应“2024年10月各分行零售AUM环比增速如下,分行1 +5.3%,分行2 +1.2%,分行3 +3.1%……(41家一级分行)”。


(2)第二轮会话


用户输入“下降超过2%的有哪几家?分别是多少?”,针对该用户问题,第二轮提问存在3个关键信息缺失,导致语义模糊,分别是:指标缺失,“下降”的对象未明确(零售AUM、储蓄存款或贷款余额等其他指标);时间维度缺失,“下降”的时间范围未明确(10月环比9月、9月环比8月或其他时间段);分析维度缺失,“哪几家”的范围未明确(各分行、各区域或各支行)。


(3)记忆检索与问题补全


记忆系统通过“短期记忆存储上下文—智能检索关联信息—语义补全缺失要素”的闭环流程,实现对缺失信息的精准补全,具体如下:补全指标,从短期记忆提取最近关联的核心指标“零售AUM”(因第一轮会话中用户唯一关注该指标,且无其他指标干扰),将其补全为“零售AUM的增速下降”;补全时间维度,关联第一轮“10月环比9月”的时间基准,补全为“2024年10月环比9月的增速下降”;补全分析维度,基于第一轮“41家一级分行”的范围,补全为“各分行中……”。


最终,用户第二轮的模糊问题被补全为:“2024年10月各分行零售AUM环比(较9月)增速下降超过2%的有哪几家?分别是多少?”。


3. 反思与自我评估


以“查询各分行客户余额平均数”问题为例,分析系统反思与自我评估的运行机制。系统首先需要明确“客户余额”的具体指向,在银行业务中,“客户余额”可能存在多义性:一是客户活期余额,指客户账户中可随时支取的活期存款余额,对应“活期余额”,可能用于日常资金流动性分析;二是考核余额,指纳入业绩考核的余额,含活期、定期及部分理财转化额,对应“考核余额”,可能用于员工绩效评估。


系统对应两种含义形成不同的问题拆解方向,需通过反思机制结合奖励函数,判断哪个方向更贴合用户真实意图。反思机制的核心是“对拆解合理性的动态审视”,通过多维度校验识别候选方向的优劣,为奖励函数提供评估依据,具体流程如下。


一是反思模块首先捕捉两个拆解方向的核心差异:定义差异——活期余额是客户实际可支配的即时资金,考核余额是经业务规则调整后的银行员工业绩统计值;应用场景差异——活期余额多用于客户资金流动性分析,考核余额多用于银行内部绩效核算;历史关联差异——检索用户过往是否有类似查询,明确其关注的余额类型。


二是反思模块触发对短期记忆(当前会话上下文)和长期记忆(历史交互记录)的检索,并进行分析,如检索到用户近3次查询“客户余额”均围绕“活期存款支取限额”、“活期利息计算”,未涉及绩效考核场景,说明用户更关注“客户活期余额”。


三是基于上述分析,反思模块形成定性判断:方向A(客户活期余额)——与用户历史意图匹配、场景适配性高、指标定义明确;方向B(考核余额)——场景适配性低(非用户当前语境)、与历史交互冲突、指标定义存在歧义。




五、应用成效




通过研究多智能体技术应用,本文构建了具备深度认知与动态优化特性的智能分析体系,该体系不仅实现了对业务人员复杂问题的自如、准确响应,更推动了ChatBI系统从被动回答向主动理解、深度推理、动态反馈的能力跃升。同时,依靠核心统筹、高效协同的能力优势,多智能体ChatBI系统在问答准确性及系统响应时间等方面均有更加出色的表现。


在某项目测试场景下,单智能体ChatBI系统问答准确率为92.5%,多智能体ChatBI系统问答准确率为98.4%。面向多智能体ChatBI系统,华夏银行在测试问题集的设计上提高了难度,新增了单智能体ChatBI系统难以处理的若干问题(如嵌套计算、多步拆分等),多智能体ChatBI系统不仅能够处理更复杂的问题类型,且准确率亦有较大提升。


在系统端到端响应时延性能测试中,对于复杂问题,单智能体ChatBI系统平均需要60秒左右完成每题回答,多智能体ChatBI系统通过并行调度多个子Agent处理问题,平均需要20秒左右完成每题回答,系统响应效率提升约3倍。


基于多智能体的ChatBI系统通过层级化体系设计、高效记忆检索、自适应推理、反思与自我评估等核心机制,有效弥补了采用单智能体等模式的ChatBI系统在专业领域应对能力、工作任务执行效率、上下文理解能力、生成结果准确性等方面存在的不足,为适应商业银行多种复杂业务场景需求提供了一种可靠的技术实现路径。


随着大模型技术的持续演进,多智能体ChatBI系统作为一种融合人工智能与商业智能的创新范式,正逐步成为商业银行数智化转型的关键支撑,其在精准营销、智能风控、智慧运营、依法合规等多个核心业务场景中,能够提供兼具效率与准确性的决策支持,推动商业银行构建更加智能、高效、安全的金融服务体系。


本文受北京市科技计划项目《基于CoE架构的银行信贷风控大模型系统关键技术研究与应用》(项目编号:Z241100001324024)支持。

华夏银行北京分行刘滢,龙盈智达(北京)科技有限公司张军、刘曦子、刘洁菲、班钰桐、陈庆洋、赵忠豪、杨璇、张月,以及北京数巅科技有限公司张文郁、刘培、李钦珑对本文亦有贡献。



END


本文刊于《中国信用卡》2025年第11期

责任编辑:崔嘉桐



53AI,企业落地大模型首选服务商

产品:场景落地咨询+大模型应用平台+行业解决方案

承诺:免费POC验证,效果达标后再合作。零风险落地应用大模型,已交付160+中大型企业

联系我们

售前咨询
186 6662 7370
预约演示
185 8882 0121

微信扫码

添加专属顾问

回到顶部

加载中...

扫码咨询