微信扫码
添加专属顾问
我要投稿
AI大模型如何重塑银行合规管理?揭秘金融科技前沿应用场景与实战案例。 核心内容: 1. 银行制度知识库的智能化升级需求与四大建设目标 2. 大模型+RAG技术架构在金融合规领域的创新应用 3. 知识图谱与多模态数据处理构建的智能风控体系
银行规章制度是银行正常运作的重要基础。随着金融科技的迅猛发展,银行业务日益复杂,法律法规、内部政策、合规要求也在不断更新。银行及金融机构的合规部门、审计部门等,都需要快速检索和获取相关的制度和政策信息,同时也面临来自监管机构的严格合规要求,对于能够实时更新法规和政策信息,确保合规性、高效的信息检索,提高工作效率,降低人为错误的制度管理和检索系统的需求日益增加。
在整个金融监管加强、金融合规严控的政策背景下,银行需要建立健全合规管理体系,确保遵循相关法律法规。随着信息技术的发展,尤其是大数据和人工智能应用如大语言模型的出现,为银行制度知识库检索系统的建设提供了技术支持。越来越多的金融机构开始重视信息化建设,尤其是在合规和风险管理领域,推动了市场对制度管理和检索系统的需求。对于制度知识库检索项目,有四大项目目标:
1. 系统目标:建立一个高效、智能、可扩展的银行制度检索系统,提升信息检索效率;
2. 业务目标:降低各大业务机构及部门在日常运营中对于制度知识的检索成本,减少因信息不对称、不全面带来的合规风险;
3. 技术目标:实现高可用性、高安全性和高扩展性的检索系统和文档管理中台,满足不断变化的政策及用户需求;
4. 用户目标:提升用户的工作效率和决策能力,提供优质的用户体验。
建立一套完备的银行制度知识库,提供便捷的检索服务;实现高效的信息管理与知识共享,支持银行内部及外部的政策法规合规。
用户需求,明确用户( 合规部门、审计部门、其他工作人员等 ) 的检索需求和使用场景;数据源分析,确认知识库所需的数据源,包括法规条款文件、外部政策文件、行业指南以及操作手册等。
包括知识库的构建、数据处理与管理、检索系统和管理平台的开发、用户界面的设计等。整个项目实施包括以下几个阶段:数据处理与整合、系统设计、开发与测试、上线与培训。
根据各部门提供的行内制度、法规、政策及相关文档,进行分部门分类别(excel/doc/pdf/markdown/html/ofd 等 ) 的标准化及定制化处理;建立数据更新机制,确保知识库信息的时效性。
项目的技术点主要体现在以下四个方面:
①采用大模型 +RAG 技术:本项目引入了先进的垂直金融零售领域基座模型——金磐大模型与 RAG(Retrieval-Augmented Generation 检索增强生成 ) 框架,实现了端到端的模型开发与优化,包括文档切分、query 改写、搜索匹配、向量库存储等,有效缓解了大模型在生成过程中可能出现的幻觉现象,确保生成内容的准确性和相关性,从而大大提高了模型的可靠性。
②采用知识图谱技术: 银行制度知识需要跨部门跨知识库的解决方案,现有的 RAG 方法往往依赖简单的数据结构,限制了它们理解基于实体间复杂关系信息的能力。并且这些系统往往缺乏必要的上下文知识,无法在不同实体及其相互关系之间保持回答的连贯性。我们基于 GraphRag 的思想构建了杭银制度图谱,将图结构纳入文本索引和信息检索中,并在图构建上做了剪枝优化,以及图问答的意图识别和多实体路径搜索,保证了对多跳复杂问题更有效的推理和召回。
③ 采用多模态大小模型协同技术: 银行业的制度文档类型不光格式多样,内容也很复杂,通常将文本、表格和图片组合在一起,以传达丰富的想法和见解。虽然 RAG 擅长理解长文本,但难以有效地集成和理解多模态内容。我们将主流的多模态大模型和小模型(包括 Clip、Sam 等)相结合,能够更高效准确地分类和理解流程图、扫描发票、大型表格等模态,实现精准问答。
④文档数据管理中台:本项目开发了一款专为开发与运维人员设计的文档数据管理中台,该平台对文档的整个生命周期进行了系统化管理,不仅提升了文档的组织性和可访问性,还确保了信息的及时更新和准确性。此外,中台还可以为各个部门和业务条线量身定制专属的多层次文档集群,以满足不同部门个性化需求,根据自身的业务特点和操作流程,快速获取所需信息,提升各类文档在存储、检索方面的便利性。
在推广方面,采取了多种策略以确保制度知识库检索系统的广泛应用。首先,线上录制系统使用的视频课程通过公司的内部渠道推广至全行,使用户能够便利地学习相关知识。此外,我们还组织线下培训合成,以便于面对面的交流和互动,帮助用户更好地理解和应用系统。为了增强使用文档的可见性,我们在工作沟通APP 中发布公告,鼓励用户积极查阅和使用相关文档,从而提高整体使用效率。
在用户反馈方面,为了及时收集用户的意见和建议,我们设置了“点踩”按钮,方便用户对内容进行快速反馈,这一功能不仅能帮助我们了解哪些部分存在问题,还能引导我们进行改进。同时,我们对用户的 query 进行算法建模分析,以识别常见需求和潜在问题,从中提取有价值的信息,帮助我们更好地理解用户需求。在系统运行方面,将用户活跃量作为重要指标进行分析,评估系统的使用效果和用户参与度。同时,我们还开发了一套问题回溯机制,确保能够快速的定位问题,保证系统稳定运行。
银行制度知识库检索系统为银行内部各部门( 如合规部门、审计部门等 ) 以及行内其他人员提供服务,带来的成效具体体现在以下几个方面:
1. 提升工作效率:通过集中管理和快速检索各类制度和政策文件,员工可以迅速获取所需信息,减少了查找资料所耗费的时间。这种效率的提升将直接影响工作进度,使得各部门能够更快地完成任务,提高整体生产力。
2. 促进知识共享与传承:制度知识库能够有效记录和分享内部经验和知识,避免信息孤岛现象,提升行内的知识管理能力。这不仅促进了部门间的协作,也能帮助新员工快速上手,从而节省培训成本。
3.降低合规风险:合规部门能够更有效地访问最新的法律法规和内部政策,从而降低因信息滞后导致的合规风险。及时了解和遵循相关规定,可以减少因违规操作而造成的潜在罚款和法律责任。
项目经验总结主要体现在以下几个方面:
首先,深入了解项目需求相当重要。在项目启动阶段,与相关方进行充分沟通,明确期望和需求,制定科学合理的开发计划。这一过程可以有效减少重复开发或废弃功能的发生,从而避免开发资源的浪费,提高项目的整体效率。
其次,在技术调研方面,对开源产品进行全面测试,充分了解这些产品的适用性和稳定性,避免后期出现不适用的情况,导致额外的迁移成本和资源浪费。
最后,在推广方面,将项目嵌入用户最常见的应用程序中,能够有效降低用户的使用门槛。这种策略不仅能够提高用户的接受度,还能促进更广泛地使用,从而提升项目的价值。通过优化用户体验,确保用户能够无缝的访问新功能,可以最大限度地发挥项目的潜力,实现预期目标。
银行内部工作涉及大量的文书报告写作工作,既包括通知公告、述职报告、心得体会等较为通用的行政和个人文书,也包括贷款报告、内审报告、合规文件等业务性很强的专用文书,利用人工智能技术,尤其是大模型技术,进行大规模资料阅读分析和写作,可以支撑银行内各个部门各个岗位的员工,具有较高的业务价值。智能报告平台利用大模型、文档解析、文档检索等人工智能技术,能够自动化处理信审过程中的数据,快速生成高质量的信审报告。平台不仅支持多源数据接入,还具备强大的分析能力和可视化展示功能,为银行的信审业务提供了强有力支持。
项目充分利用生成式大模型及大模型写作工具的能力,基于银行对写作数据需求、模板需求、审核需求,在通用写作产品的基础上,增加多源数据对接、数据理解分析、模板写作、溯源审核等功能,形成银行可信写作平台。
围绕贷款审查业务和日常办公两个场景,开发了信贷报告生成和办公文稿两大系列十余种文档写作功能。包括:
对公初审报告:基于支行尽调报告、行内系统数据,通过大模型分析和智能生成能力,提炼企业信息、贷款申请信息、股东信息、财务数据、抵押信息等关键数据,按照分行对公初审报告模板,一键生成分行对公初审报告。
个贷初审报告:基于支行尽调报告数据,通过大模型分析和智能生成能力,提炼借款人基本情况、用款企业情况、抵押房产情况等关键数据,按照分行个贷初审报告模板,一键生成分行个贷初审报告。
初审报告摘要:基于总行初审报告,通过大模型能力,提炼企业信息、报审方案、财务数据、抵押信息等关键数据,按照总行摘要模板,一键生成初审报告摘要。
总行通知:通过内置提示模板对用户输入进行引导,通过更改标题、时间、对象等信息,快速生成对应类型的通知内容,提高工作效率和内容质量。
PPT 大纲:利用大模型来组织和整理信息,明确展示的重点和逻辑流程,为后续的内容创作提供清晰的框架。提高制作效率、确保内容完整性和逻辑性。
心得体会:基于预设的框架,心得体会可以在短时间内自动生成,有效节约时间成本。通过变换模板中的关键词可生成多样化的内容,以增加文本的丰富性。
新闻稿:通过大模型生成的新闻稿可以保证品牌信息的一致性、降低语言错误的可能性。有助于提升品牌稳定性。
工作汇报:快速生成和高效的工作汇报可以更频繁地更新项目状态和业务洞察,为管理层提供及时的信息,帮助他们做出更为数据驱动的决策。
工作进展汇报:利用先进的大模型技术,生成高质量、风格一致的工作进展汇报文档。有效减少人工编辑时间,确保信息的准确性和时效性,同时强化品牌形象的稳定性与专业性。
工作计划撰写:基于大模型技术的智能工具,帮助用户快速、准确地制定符合要求、结构清晰、目标明确的工作计划。提升工作效率与规划质量。
项目技术特性:
1. 项目基于大模型的可信公文创作技术,以 Transformer 为核心的生成式人工智能技术始终面临幻觉问题,这给 AIGC 技术在工业界(尤其是看重准确性、可信性的金融领域)的应用带来了限制。本项目研发了可信公文创作技术,通过将智能生成、检索生成、模型自省、专家框架、智能溯源等技术的落地实现和综合运用,解决了AIGC 模型在具体应用中不可解释、不可追溯的黑箱问题,为大模型在金融创作场景的落地开辟了一条道路。
2. 基于大模型的文档解析技术实现 PDF、WORD、TXT 等多种格式,尽调报告、初审报告等多种类型的文档解析能力,针对不同格式、不同类型的文件,采用不同的文档解析模块,构造对应知识树,满足公文创作场景下的文档处理需求。本项目采用基于大模型的文档解析技术,WPS 文档解析模块基于文档解析引擎提取文字内容。PDF 解析模块将结合文档版面分析、表格识别、段落文字块合并等多项技术,以准确划分标题、文本段落、图片、表格等内容信息,从而实现对文档段落结构的精确恢复,最大程度地保留文档的语义信息;并针对不同类型构造对应知识体系,最大程度保留了文档的知识信息。
3. 兼容适配多模板报告创作,大模型根据不同的报告模板自动解析报告目录,拆解问题 , 基于知识体系明确各部分内容的取数来源及撰写要求,依据撰写要求及取数来源,从知识库中查询数据。基于大模型 prompt 工程,利于大模型生成对应的输出内容。并基于索引服务,明确生成内容的数据来源,从而实现结果溯源和数据稽核。这样一套完善的报告生成流程可以帮助系统更加高效地生成各类报告,确保报告内容的准确性和可靠性。
智能报告平台全面上线,支持总行初审、分行初审岗位业务人员进行信贷初审报告的编辑审核工作,相关岗位人员涉及10000 人左右,帮助业务人员从原先最快 3 天完成一份完整报告到 5分钟生成、半天审核完成一份初审报告,提升初审效率 80% 以上。
智能报告平台可轻松解决信贷审批过程中,海量非标数据处理难、数据信源不统一的问题。贷前审核过程中涉及大量企业信息,完全依靠人工进行核实和梳理需要耗费大量时间和精力,效率较低,且容易发生人为错误和疏漏。且信贷报告中使用的大量企业信息源自访谈、底稿、研究报告甚至互联网信息,各个信息源的可信度不尽相同,根据不同信息得出的观点也大相径庭,审核者难以一一查证来源,确认可靠性。
1. 提高工作效率
自动化生成:智能报告平台能够自动化完成报告的生成过程,减少了人工编写报告的时间和精力。传统报告编写需要人工收集数据、分析数据、撰写报告等多个步骤,而平台则可以在短时间内完成这些工作,大大提高了工作效率。
快速响应:在需要快速生成报告的场景下,如总行通知、工作进展汇报等,智能报告平台能够迅速生成报告,确保信息的及时传递和决策的快速制定。
2. 提升报告质量
精准分析:智能报告平台通过大模型及文档解析、向量化等技术,能够对数据进行深度挖掘和分析,生成更加精准、科学的报告内容。
丰富多样:智能报告平台能够生成包括文本、表格、图像等多种形式的报告内容,使报告更加直观、易懂。
3. 降低成本
减少人力成本:智能报告平台的自动化生成功能减少了人工编写报告的需求,从而降低了行内的人力成本。行员可以将更多的人力资源投入到其他更有价值的工作中去。
降低错误率:人工编写报告容易出现错误和疏漏,而智能报告平台则能够通过算法和模型来减少这些错误和疏漏的发生,提高报告的准确性和可靠性。
智慧创作平台基于银行实际业务需求,利用大模型技术开发了贷款审查和日常办公的智能写作工具,打通了银行内部的信贷、风控系统与外部数据库,实现了报告生成的自动化和溯源功能。通过配置不同业务模板,项目有效提高了信审报告生成和审核的效率,简化了人工修改与审核流程,显著提升了审批质效。在推广过程中,项目结合银行业务场景不断优化,得到了广泛好评,成功推动了银行数字化转型和智能风控体系的建设。
随着保险行业竞争加剧,银保渠道作为核心业务增长点,亟须通过精细化运营提升销售效率。银保渠道每周需召开600 余场销售复盘会议,传统管理模式面临多重挑战:一是会议录音转写错误率高,非结构化内容导致管理层难以快速获取有效信息;二是人工回听录音耗时耗力,单次会议分析需消耗管理人员 1 小时以上;三是优秀销售经验依赖业务专家主观筛选,案例覆盖范围有限;四是总部对一线经营动态感知滞后,难以及时响应市场变化。
在此背景下,智能化改造工程明确三大核心目标:一是通过自动化质检与摘要生成,实现会议内容结构化分析;二是构建多维度数据分析模型,精准洞察一线共性问题和市场动态;三是建立动态知识库,推动优秀案例全域共享,赋能销售队伍能力提升。
行业专有大模型融合保险专业词库与历史业务数据,通过切片预处理、多轮微调和后置校验机制,攻克保险术语识别、多角色发言区分等技术难点。例如,针对会议中常见的“增额终身寿”“个养产品”等专业词汇,优化 ASR 模型后识别准确率提升至 95%;通过长文本切片技术,将单次会议 1 小时的录音分割为 15 个逻辑段落,显著提升大模型上下文理解能力。
“质检 - 萃取 - 复制”三位一体管理体系。质检模块从流程合规性、内容深度、情绪识别等维度量化会议质量,自动生成评分报告;萃取模块通过双重分析机制,先提取单场会议热词与客户案例,再聚合全域数据形成共性洞见;沉淀模块构建动态知识库,将优秀案例直接推送至外勤展业 APP,形成“分析 - 改进 - 复制”的业务闭环。
引入恶意行为识别与互动性分析技术,量化评估会议内容与参与度。例如,结合语义分析判断讨论焦点,帮助管理层识别会议异常行为,及时过程管理,确保总部要求贯彻落实。
构建多源数据处理平台,整合语音、文本及业务系统数据。通过优化ASR 模型,保险专业术语识别准确率从 82% 提升至 95%;建立噪声过滤机制,有效消除会议背景音干扰。针对长文本处理难题,开发上下文关联算法,确保跨段落语义连贯性。
设计可视化管理看板,支持多维度数据钻取。管理人员可通过热词词云、趋势图谱等工具快速定位问题;一线销售通过外勤APP 查看标杆案例,平均学习时长从 30 分钟缩短至 8 分钟。技术实施中攻克三大难点:一是通过角色分离算法,准确区分保险顾问、银行客户经理等发言主体;二是设计异常结果自动重试机制,当模型输出偏离阈值时,系统自动触发二次分析;三是建立人工复核通道,每月抽样5%的会议结果进行校验,持续优化模型参数。
效率提升:管理人员日均处理会议数量从8 场增至 20 场,信息提取效率提升 60%;人工回听工作量减少 80%,每年释放 4000 人天用于高价值分析。会议流程合规率从 73% 提升至 96%,恶意踩点行为减少 82%。
知识沉淀:
1. 萃取热点话题,判断政策是否直达。例如,银保业务首季红期间紧盯“重客储备”进度,紧跟“分红险产品及个养产品”推动,从萃取平台可以看到当期开会的热议话题与总部策略方针方向一致,说明政策层层宣贯,落地执行情况较好。
2. 萃取热议问题,推动赋能问题解决。萃取平台还专设热议问题模块,将银保业务专家的经营理念借助大模型技术结构化呈现,实时识别提炼开会中提及的网点经营、客户经营的难点与痛点,比如队伍在“识客户”环节提及较多的问题是客户邀约存在困难、客户对保险产品有疑虑等,业务专家或各级管理人员就可以根据现存问题,有针对性地提出解决方案,赋能一线经营。
3. 萃取经营标杆,看见优秀,学习优秀。萃取平台还能提炼出在开会过程中提及的成交客户案例进行总结分析,比如企业家客群主要通过购买增额终身寿产品,实现家企资产的隔离;而购买个人养老金产品鑫福享的客户主要担心利率下行,看重长期锁定利率。对于萃取的成交案例,银保全员可见,方便队伍看见优秀,学习优秀。
直接成本节约:自项目创立以来,人工质检复核的工作量大幅减少。据统计,每位经营管理人员的日均成本约为3000 元,通过优化流程,每年可节省超过 1200 万元的人力成本,极大提升了管理效能。
业务增长贡献:通过大模型技术聚合销售话题和客户经营案例,形成标杆案例库,促进优秀经验的复制和共享。这不仅提高了质检模型的智能化水平,优化了语音转文本的准确性,还实现了会议流程的自动化判断。此外,平台通过结构化提炼会议内容,快速捕捉关键信息,洞察共性话题,并提炼优秀案例,为其他会议提供参考。
业科深度融合,建立“业务需求池 - 技术开发池”双轨机制,业务专家全程参与模型训练与结果校验,确保功能贴合实际场景。
敏捷迭代体系,构建“数据采集 - 模型训练 - 人工校验”闭环,通过每两周优化会议持续提升系统性能。
知识资产化运营,将萃取成果系统化编入公司级知识图谱,支持多场景复用。
已有的训练系统已实现基础的学练考评和基础管理内容建设。但仍存在能力评估粗放,缺乏数据化评估工具,难以精准定位代理人能力短板;训练效率低下:标准化课程无法满足个性化需求,难以实现因材施教;管理穿透不足:总部机构难以快速知晓一线实际培训情况,无法做到过程和行为管控。在此背景下,进行该项目建设,明确项目三大核心目标:一、构建代理人能力评估体系,实现从“经验驱动”到“数据驱动”的转型;二、打造智能化训战闭环,缩短培训周期并提升实战转化率;三、建立总部到一线的全流程穿透式管理,推动业务策略精准落地。
技术融合创新:能力画像引擎:基于Transformer 架构的大模型,融合知识图谱与历史业务数据,构建代理人多维能力标签(如产品知识、客户洞察、异议处理);虚拟陪练引擎:基于通义千问大模型与语音交互技术,模拟 20+ 实战场景(如客户异议处理、产品讲解),根据场景进行多类角色扮演,角色扮演一致率达到 80%+;动态推荐算法:自动化采集学习行为数据,结合当前代理人所处销售阶段,优化个性化学习路径。
业务模式重构:训战一体闭环:首创“测 - 学 - 练 - 考 - 评 - 管”六阶段模型,将传统单向培训升级为“诊断 - 训练 - 验证”动态循环;知识资产化运营:通过 AI 萃取优秀代理人销售话术案例,构建动态知识库。
管理模式升级:全链路穿透式管理,总部可实时追踪多家机构训练计划执行情况、全国10万 + 代理人的训练进度与效果,通过数据看板识别低效机构并定向干预,确保要求落实到位。
数据层:构建多源数据处理平台。融合代理人客经、培训、授课等多维度数据。模型层:针对角色扮演、智能点评,打造大模型能力+ 小模型能力,确保模型评价时准确理解文本内容。应用层:设计智能金牌教练队伍端和管理端应用,实现训练场景管理角色和用户角色即时联动。
技术实施中攻克三大难点:一是通过角色扮演算法,确保模型扮演的角色能根据代理人描述内容进行灵活响应及答复,同时当代理人描述内容偏离主题时,进行及时的场景拉回和提示;二是设计内容生成复核机制,从原始素材到培训素材的生产过程中,支持生成后人工复核校验;三是建立人工复核通道,每月抽样对练内容及评价结果进行校验,持续优化模型参数。
通过智能金牌教练,将原本需要逐层级反馈的机构训练情况由周级缩短为小时级,同时实现对代理人能力情况的实时观测和分析。月均节约主管辅导时长约5 小时,内容准备效率提升 50% 以上。
智能金牌教练不仅提升了内勤训练人员准备训练素材的效能,也为公司训练管理工作注入智能动力。同时,其成功应用也为其他业务场景提供了宝贵借鉴,推动公司整体决策的科学化进程。
自项目创立以来,根据测算,通过逐步线上化训练,每年预计可节省超过2000 万元的人力成本,极大提升了训练效能。管理效能提升 30%+。
响应监管关于推动深化人身保险行业个人营销体制改革要求,提升保险销售人员专业化水平。做好队伍的全流程数字化管理,增强保险销售人员的合规意识、专业水平和服务能力, 提升客户满意度。
业科深度融合,建立“业务需求池 - 技术开发池”双轨协同机制,由业务专家主导提炼代理人能力评估标准、实战场景库等核心需求,技术团队同步构建大模型训练框架与评估算法。业务专家全程参与模型训练与结果校验,确保能力画像与真实展业场景高度契合。
数智化训战SOP 体系,构建“数据采集 - 模型训练 - 人工校验”闭环,后续可以复制到内勤培训、讲师培训等多类场景。
知识资产化运营,将萃取成果系统化编入公司级知识中心,支持多场景复用。
在当今数字化浪潮席卷各行业的背景下,金融领域正面临着前所未有的变革机遇与挑战。金融工作会议明确提出,要加快建设金融强国,充分把握数字技术革命带来的契机,大力推动金融与数字技术的深度融合与创新,全方位加快监管数字化智能化转型进程。
在此政策引领下,致力于深入挖掘数字化转型的多元场景,从规章制度的建设以及日常运用实践为切入点,依托大模型技术开展深入研究探索,旨在打造一个能够显著提升业务知识和规章制度使用效率与传导效果的企业智慧问答系统。企业智慧问答系统共分为智慧制度与智慧财务两大模块,为全司员工营造便捷获取财务费控报销相关信息和规章制度知识的环境,精准识别员工提问意图并高效匹配相应规章条款,赋能一线员工专业素质提升。
长期以来公司业务知识和制度规章繁多、分布零散、难以查找,同样的,企业内部的财务板块也面临着亟待解决的难题。财务人员每日深陷大量与费用报销相关的咨询工作泥潭,各类问题高度相似且重复性极强,致使人力成本不断攀升,工作效率却受限难以提升。尽管企业内部积累了海量的业务和管理数据,并且已配套建设多个功能模块助力数据应用,但由于不同系统间存在差异,业务流程复杂度高,用户在准确获取所需数据时困难重重,往往需要对系统和业务有深入且全面的了解才能完成数据提取任务,这无疑进一步抬高了数据利用的门槛与难度,严重制约了企业运营效率的提升。
鉴于上述复杂严峻的形势,本企业智慧问答系统项目应运而生。项目旨在凭借先进的人工智能技术,充分挖掘大语言模型的强大潜能,对企业内部的财务咨询与数据获取流程进行全面优化升级,从而提升整体运营效率与服务质量,为企业在数字经济时代的持续稳健发展提供坚实有力的支撑。
l智慧制度:
数据驱动,创新性提出多维度评估规章制度和业务知识,对制度和知识按公司治理要求进行科学分类,开展存量制度数据治理、建立增量制度管理机制,标本兼治,有效归集知识库。智能知识梳理,按照一定规则帮助业务人员高效梳理规章制度和业务知识,快速形成知识库。大模型人机交互,利用大模型技术优化人机交互体验,降低业务人员获取规章制度和业务知识时的个人知识积累门槛。
1. 文档预处理阶段
文档筛选:对内规库文件进行全面梳理,依据业务相关性、法规效力等标准,剔除过期、失效及与核心业务关联度低的非必要文件,筛选出有效的内规文件集合。
文本切分:将筛选后的有效内规文件进行切分,按照合理的语义单元(如按章节、条款等)将其分解为多个文本片段,便于后续处理和检索。
向量编码与存储:调用文本向量化模型,将切分后的文本片段编码为高维语义向量,捕捉文本深层次的语义信息,并将这些语义向量存储于高性能的向量数据库中,为后续的语义匹配奠定基础。
2. 大模型微调阶段
模型选择:在众多预训练大模型中,经过充分评估和对比,选定与业务领域契合度高、具备较强语言理解和生成能力的基础大模型作为初始模型。
数据准备:收集整理内规文档以及相关的高质量问答对,问答对涵盖内规的核心内容、常见业务场景中的合规问题及解答等,作为模型微调的数据集。
微调训练:利用准备好的数据集对选定的大模型进行监督微调,通过调整模型参数,使模型学习到内规领域的专业语言风格、知识要点和问答逻辑,从而提高模型对内规相关问题的回答准确性和专业性。
3. 在线问答阶段
问题处理与语义匹配:当用户提出内规相关问题时,系统首先利用语义模型将问题文本转换为语义向量。同时,结合经典的BM25 算法,综合计算问题语义向量与内规文本片段语义向量的相似度,快速、精准地从向量数据库中检索出若干个与问题语义最接近的内规文本片段。
提示词构建与回答生成:将匹配到的相关内容章节文本片段与用户问题进行整合,精心构建为适合大模型输入的提示词。将该提示词输入微调后的大模型,大模型依据其强大的语言生成能力,基于提示词中的信息和已学习到的内规知识,生成针对用户问题的详细、准确、专业的回答内容,并将回答反馈给用户。
4. 持续优化阶段
Agent 服务架构:系统内置 Agent 服务,负责统筹协调用户请求中涉及的各项具体任务。Agent 服务可灵活调用多种专业工具,包括语义理解工具用于精准解析用户问题语义;数据召回工具高效检索内规知识库;数据重排工具对检索结果进行优化排序;API 调用工具整合公司内部其他相关系统数据;以及复杂计算工具处理涉及合规指标等的复杂计算任务。
幻觉问题解决与优化:借助Agent 的精准召回能力,能够在大模型生成回答前,对相关信息进行严格筛选和验证,有效减少大模型可能出现的幻觉问题,确保回答内容的准确性和可靠性。同时,基于用户与系统的交互数据,包括用户反馈、新出现的内规问题及解答等,Agent 不断对系统进行自我优化和迭代,持续提升系统性能和回答质量。
l智慧财务:
(1)极简架构设计:摒弃冗余组件。完全舍弃向量数据库、向量模型、多路召回策略等复杂技术栈,无需混合检索(如全文检索+ 向量召回)和资源隔离运维。去人工化设计,无需人工定制数据切片策略、存储加工策略或召回策略,避免因复杂系统带来的开发维护成本。
(2)数据处理与算力优化:动态信息处理,通过动态文件过滤和窗口分区(而非固定 chunk 切割),避免数据切片导致的信息丢失和排序干扰。上下文完整性,利用大模型直接处理原始文件(非碎片化文本),保留完整语义关联,消除chunk同质化问题。暴力美学计算,基于大模型支持超长上下文(百 K token 输入),通过窗口分区管理(文件区、片段区、系统缓冲区),最大化利用 GPU 算力。性能与成本优化,极限缓存命中(缓存与 miss token 比例 2:1)降低推理成本;仅需个位数 token 输出,规避解码瓶颈,扩展性极强。
(3)工程创新与优化:全流程大模型驱动,从文件筛选到答案生成,全程依赖 LLM 自主决策(非人工规则),减少人为干预导致的性能天花板。实时性与灵活性,动态响应query需求,无需全量更新向量库(对比一代RAG依赖批量更新),适应实时场景。LLM-Native 设计,完全围绕大模型能力构建(非依赖传统 NLP 组件),通过算法创新(如 128k 窗口分区)实现效果跃升。无预处理的端到端流程,无需复杂数据预加工,直接处理原始代码 / 文档,避免预处理导致的信息扭曲。
(4)用户请求触发检索流程,系统智能调用三个模型实现高效筛选。初始阶段简单检索模型依据段落特征快速初步筛选,初步定位关键信息;小参数量大模型(参数量140 亿 ) 对全文进行初筛,凭借其轻量级优势快速过滤无关内容;同类型小参数量大模型接力进行全文二筛,进一步优化筛选结果,精准定位关键信息;将筛选后的文档传递给大参数量大模型 (参数量 720 亿 ),由其深度处理并生成精准回答,整个流程智能高效,确保高质量的检索与回答生成。
直接经济效益:大幅降低人工工作量:AI 机器人可替代部分基础咨询工作,减轻人工处理工作量,可更好地服务业务。 提高处理效率:机器人可 24/7 实时响应,缩短用户等待时间,提升整体效率。 减少错误率:自动化回答可避免人工解答的疏漏,降低因错误信息导致的重复沟通和标准出入。
间接经济效益:提升员工满意度:快速、准确地解答能提高内部用户(员工)的体验,减少因报销问题导致的负面情绪。优化财务团队工作重心:释放员工精力,使其专注于高价值任务(如数据分析、流程优化),提升整体财务效率。增强数据洞察能力:通过机器人收集的高频问题,为后续流程优化提供数据支持。
技术效益:推动企业智能化转型:落地AI 技术应用,积累经验,为未来更多场景的 AI 部署奠定基础。提升系统集成能力:机器人可与现有系统(如 ERP、OA)对接,强化企业技术生态的协同性。
战略效益:支持规模化发展:随着公司扩张,机器人可无缝应对咨询量增长,避免人力资源的线性增加。前瞻性布局:抢占AI 在财务领域的应用先机,为未来智慧财务(如自动化审核、预测分析)积累经验。
技术架构与业务需求深度融合,保障项目实效性:
1. 对接业务需求:深入剖析企业知识管理与财务咨询等业务流程中的痛点与难点,将其拆解为多个具体的应用场景。通过打造智能问答核心引擎、多源知识整合、精准答案推送等关键模块,确保系统功能紧密贴合业务实际需求。
2. 分步推进项目实施:运用“需求调研—模型选型—系统开发—测试优化—推广应用”的逐步推进模式,加速项目从概念设计到全面落地的进程,确保各阶段成果都能有效承接并推动后续工作开展。
智能技术优化提升,构建长效运营机制:
1. 智能问答性能优化:建立系统性能监测体系,实时追踪问答准确率、响应时长、用户满意度等关键指标,依据数据反馈对模型参数、知识库结构、问答逻辑进行持续优化,实现问答质量与效率的螺旋式提升。
2. 全员赋能知识共享:公司内部成立跨部门项目推广小组,采用线上线下联动的方式,为 27 家分公司及总部21 个部门提供培训,着重讲解智能问答系统的应用场景拓展、知识更新维护以及复杂问题处理技巧,打造企业内部知识共享与智能协作的良性生态。
随着国家数字经济战略的深入推进和人工智能技术的飞速发展,金融行业的数字化转型已进入深水区。在这一浪潮中,数据被提升到前所未有的战略高度,成为驱动业务创新和精细化运营的核心生产要素。我行积极响应国家关于强化科技创新、推动金融高质量发展的号召,深刻认识到数据资产化、知识化、智慧化的重要性。正如《新一代数据架构》所倡导的,数据架构需向以知识和智慧为方向的更高价值密度演进。
在数字经济战略驱动下,金融业正加速向智能化转型。数据作为核心生产要素的战略地位日益凸显,但传统数据服务模式面临多重结构性挑战:一是系统架构之困—经过多年信息化建设,银行普遍存在多套异构业务系统,数据整合效率低下,需求交付周期难以匹配业务敏捷化要求;二是人机协同之困—业务人员普遍受限于数据库等专业技术,长期依赖 IT 部门支持,导致数据价值释放滞后于业务创新节奏;三是安全发展之困—多数 AI 技术链依赖外部厂商,存在核心技术受制于人和数据安全隐患。正如《新一代数据架构》所指出,数据服务需向知识化、智慧化方向演进,方能实现价值密度跃升。
作为地方性金融机构,我行已完成数据治理体系的基础建设,构建了统一数据仓库、实时计算平台、数据中台等核心能力。然而,实践中仍存在四大痛点:
数据“可用”与“易用”的鸿沟:尽管我行已建成强大的数据中台和各类数据服务,但业务人员在实际用数过程中,仍高度依赖 IT 部门进行数据提取、报表开发,响应周期长,难以满足日益敏捷化、场景化的业务需求。
业务需求与技术实现的错配:业务人员难以用精确的技术语言描述其数据需求,而IT 人员对业务场景的理解深度有限,导致沟通成本高,数据成果与实际业务目标可能存在偏差。
数据价值释放不充分:海量数据中蕴藏的洞察和知识未能得到充分、高效地挖掘和利用,业务决策的智能化水平有待提升。一线业务人员渴望更直接、更便捷的方式洞察数据,赋能日常工作。
对自主可控技术的要求:在核心技术领域,特别是人工智能和大数据处理方面,积极采用并发展国产化技术,确保金融系统的安全稳定与长远发展。
在此背景下,大语言模型(LLM)技术的突破为解决上述痛点提供了革命性的路径。本项目通过构建基于大模型的智能问数,将复杂数据分析能力赋予业务人员,旨在打通数据服务的“最后一公里”,实现“人人用数据、时时用数据、处处用数据”的愿景,真正做到“用数赋智赋能业务发展”。
本项目以我行现有成熟的数据服务体系为坚实底座,通过引入先进的大语言模型技术,构建“大模型驱动的智能问数应用”。其核心目标在于通过技术革新,重塑我行业务人员与数据交互的方式,全面提升数据要素的价值创造能力,为我行高质量发展注入强劲的数智动能。具体目标归纳如下:
一是实现业务用数的范式革新与极致提效。本应用旨在赋予业务人员通过自然语言便捷、高效地进行自主数据查询与即时分析的能力。这将极大降低用数门槛,使一线人员能够独立、快速地响应业务变化,显著缩短数据获取与分析周期,支持敏捷决策。长远来看,便捷的用数工具将积极培养业务人员的数据思维和分析能力,营造“人人用数据、时时用数据、处处用数据”的浓厚数字化氛围,从而加速我行整体数字化转型进程,全面提升全行数字化作业水平与运营效能。
二是深化数据智慧洞察与知识赋能决策。该应用致力于推动数据从原始记录向结构化信息、业务知识乃至决策智慧的逐级转化与价值沉淀。通过大模型的理解与分析能力,辅助业务人员更深层次、更精准地洞察数据背后隐藏的规律、市场趋势与潜在业务机遇,从而显著提升业务决策的科学性、前瞻性与精准度。
本项目在深入研判金融行业数字化转型趋势、充分借鉴业界先进经验的基础上,紧密结合我行多年信息化建设所积累的坚实成果与独特优势,进行了一系列具有实践性的关键创新。主要体现在以下三个方面:
(一)架构创新与自主可控构建基于“Text2API”的国产化智能问数新范式,兼顾敏捷与稳健。本项目在自然语言到数据的转换路径选择上,独辟蹊径。业界虽有直接“Text-to-SQL”的技术方案,但该方案在处理涉及复杂多表关联、深层嵌套查询以及特定业务逻辑封装时,大模型往往难以生成完全准确且高效的 SQL,尤其在我行业务系统繁多、数据模型关联复杂的背景下,错误 SQL 的风险与后期维护成本极高。为此,我行创新性地确立了以成熟、稳定、安全的数据服务 API 作为大模型统一调用“后端”的核心架构。这一“Text2API”模式,既充分复用了我行多年数据中台建设在数据标准化、服务化封装、业务逻辑沉淀及统一出口管控等方面的宝贵成果,又通过大模型赋予了这些既有服务自然语言交互的“前端”智慧能力。此举大幅降低了业务人员直接操作底层数据库的潜在风险,巧妙规避了复杂 SQL 自动生成的业界难题,显著简化了大模型理解和处理复杂业务逻辑的难度,实现了“前沿 AI 技术”与“稳健企业级架构”的完美融合与高效协同。
(二)融合赋能与安全保障深度践行“数据智理”与“用数赋智”,并以金融级安全体系保驾护航。在“数据智理”层面,规划通过结合大模型强大的自然语言理解与上下文感知能力,帮助业务用户更透彻地理解数据来源、加工过程与业务内涵,从而建立对数据的信任感,提升数据应用质量。在“用数赋智”层面,该应用直接赋能各级业务人员进行自助式、探索式的数据获取与即时洞察,使其能更便捷地将数据转化为驱动日常工作、优化业务流程、创新产品服务的智慧与动能,有力推动全行数据驱动型业务模式的构建与深化。
(三)敏捷迭代与前瞻进化坚持业务价值驱动的敏捷开发。本项目自始至终秉持以业务价值为导向的敏捷开发与迭代理念。从项目启动初期,便请核心业务部门深度参与需求梳理、场景共创和原型验证。通过“快速上线、小步快跑、持续反馈”的迭代模式,项目团队能够迅速捕捉用户在实际使用中的痛点与期望,并据此不断调优模型交互策略、完善应用功能设计、拓展高价值应用场景。这种紧密围绕业务需求、快速形成“应用 - 反馈 - 优化 - 再应用”的闭环机制,确保了技术创新与业务价值实现的紧密贴合和持续交付。
大模型驱动的智能问数应用”其业务功能设计深度聚焦于解决一线业务人员在日常工作中面临的数据获取难、理解难、应用难的痛点,致力于通过前沿的人工智能技术,构建一个围绕“便捷交互赋能、智能洞察驱动、安全可控保障”三大核心原则的全新数据服务生态。精确或歧义,模型具备模糊查询处理与智能容错能力,能通过引导式反问或提供候选选项辅助用户明确意图。
1. 自然语言驱动的智能查询与深度交互
该应用的核心革新在于赋予业务人员通过自然语言进行复杂数据查询的强大能力。用户无需掌握专业技术背景,仅需输入日常业务用语,系统内置的“Text2API”引擎便能凭借强大的语义理解和意图识别能力,自动将自然语言精准转换为对后台数据服务 API 的调用。该应用支持流畅的多轮对话,用户可进行追问、筛选或维度深化,模型能智能保持上下文关联,无需用户重复前提,使得数据分析如自然沟通般高效。针对用户表述可能存在的不精确或歧义,模型具备模糊查询处理与智能容错能力,能通过引导式反问或提供候选选项辅助用户明确意图。“大模型驱动的智能问数应用”其业务功能设计深度聚焦于解决一线业务人员在日常工作中面临的数据获取难、理解难、应用难的痛点,致力于通过前沿的人工智能技术,构建一个围绕“便捷交互赋能、智能洞察驱动、安全可控保障”三大核心原则的全新数据服务生态。精确或歧义,模型具备模糊查询处理与智能容错能力,能通过引导式反问或提供候选选项辅助用户明确意图。
2. 结构化结果呈现与交互式智能可视化分析
无论后台API 返回何种格式数据,该应用均会自动解析并转换为易读的结构化形式,如动态表格、列表或关键指标卡片,用户可进行在线排序、筛选等操作。系统能根据数据特点和用户意图,智能推荐并即时生成多种合适的图表(如折线图、柱状图、饼图等),用户可与图表进行下钻、上卷等交互操作,实现从数据到图形洞察的无缝转换,极大提升数据解读的直观性。
3. 金融级精细化权限管控与全链路安全审计保障
数据安全与合规是平台的生命线。该应用与本行统一身份认证系统深度集成,确保用户身份的严格认证与唯一性。在此基础上,构建了严格且灵活的多维度数据查询权限管理体系,与用户岗位及所属机构层级(总行、分行、支行、网点)紧密绑定,确保用户仅能访问其职责与机构层级授权范围内的数据和服务API。
核心的用数权限管理模块和全流程问答日志查询与审计功能已稳定高效运行,为应用的安全合规运营提供了坚实的技术保障。为拓宽智能问数的服务边界和应用深度,在首批已接入的核心业务API 基础上,运营团队正根据业务发展优先级和试点用户的实际需求,与数据中台及各业务系统团队紧密协作,动态梳理并有计划地逐步对接更多领域、更深层次的数据服务接口。
该应用日均处理用户各类自然语言查询数千次。试点用户普遍对应用提供的自然语言交互方式的便捷性、数据获取的即时性以及操作的友好性表示高度认可,并积极地为应用的进一步完善建言献策,形成了良好的互动氛围和应用生态雏形。虽然应用尚处于运营初期,但其在赋能业务决策、提升工作效率、降低用数门槛等方面的潜力已初步显现。随着模型交互效果的持续增强、功能的日益丰富、接入数据范围的不断扩大以及用户群体的逐步推广,预计各项关键运营指标将呈现稳步提升的良好态势,该应用的业务价值也将得到更充分的释放。
首先,在赋能业务人员自主用数、提升数据驱动决策能力方面成效初显。试点业务用户已能突破传统数据获取模式的束缚,通过自然语言直接与该应用进行交互,便捷、高效地获取此前需依赖IT 支持或复杂 BI 工具操作方能得到的数据。
其次,在关键技术自主可控与应用经验积累方面取得了重要突破。本项目坚定践行国家信创战略,成功依托我行超百卡国产算力集群,完成了大模型在金融核心业务场景下的应用适配、稳定部署与高效运行。这实现了在数据探索与创新应用、提升用数灵活性的同时,有效防范数据泄露和误用风险,充分体现了“安全是发展的前提,发展是安全的保障”的理念。
随着该应用功能的持续迭代完善、模型智能水平的不断进化以及应用范围的逐步推广与深化,预计未来在进一步降低运营成本、提升全行决策质量与效率、创新金融产品与服务模式、增强风险精准防控能力等方面的成效将更加显著和量化。本应用将为我行在日益激烈的市场竞争中注入强大的、可持续的“数智动力”。
大模型驱动的智能问数应用的建设与初步运营,是我行在人工智能时代积极拥抱新技术、探索数据价值释放新路径的宝贵实践。在此过程中,积累的关键经验在于:坚实的数据底座是前提,我行多年数据治理与中台建设为项目成功奠定了基础;场景驱动与业务深度融合是关键,确保技术方案能真正解决业务痛点并创造价值;坚定国产化技术路线不仅保障了项目自主可控,更提升了核心技术能力,对金融安全具有重大战略意义;大模型在金融领域的应用适配是一个持续优化、体系化运作的复杂过程,需结合领域知识与用户反馈不断迭代;同时,复合型人才培养与跨部门高效协同是项目成功的组织保障。这些经验深刻揭示了技术创新与业务实践相结合的内在规律,为未来深化数字化转型提供了重要启示。
53AI,企业落地大模型首选服务商
产品:场景落地咨询+大模型应用平台+行业解决方案
承诺:免费POC验证,效果达标后再合作。零风险落地应用大模型,已交付160+中大型企业
2025-08-06
企业级智能体开发中所遇到的问题以及解决方案
2025-08-06
AI 场景内存降本 95%!一文看懂 OceanBase BQ 向量量化
2025-08-06
AI编程实战:AI要独立开发了?TRAE SOLO 后端生成能力深度实测
2025-08-06
AMD 显卡解锁 Ollama 支持:没有 N 卡也能跑大模型
2025-08-06
【重磅发布】Claude Opus 4.1等模型现已接入Refly
2025-08-06
20个进入实用阶段的AI应用场景(咨询公司篇)
2025-08-06
断网后,你的 AI 还能用吗?
2025-08-06
最佳实践|Zilliz 如何助力MiniMax的AI落地与预训练数据管理
2025-05-29
2025-05-23
2025-06-01
2025-06-07
2025-06-21
2025-06-12
2025-05-20
2025-06-19
2025-06-13
2025-05-28
2025-08-06
2025-08-06
2025-08-06
2025-08-05
2025-08-05
2025-08-05
2025-08-04
2025-08-02