微信扫码
添加专属顾问
我要投稿
AI大模型正在重塑银行尽调流程,智能分析助力风险识别与决策效率提升。核心内容: 1. 数智尽调平台整合多渠道数据,实现高效清洗与标准化处理 2. 基于风险指标构建客户360画像,实现负面事件智能筛查 3. 量化模型驱动智能决策,结合机器学习优化风控与营销策略
银行授信业务的尽职调查作为信贷业务开展的核心环节,对于评估企业风险、保障资金安全以及制定合理的金融服务策略起着至关重要的作用。然而,传统的人工尽调方式在数据获取、处理效率、风险识别等方面存在着诸多不足,已难以满足现代银行业务快速发展的需求。近年来,生成式人工智能的迅速发展正在重塑银行未来业态,银行业已开启数字化转型“加速跑”。
数智尽调平台以公司业务尽职调查作为大模型应用“小切口”,构建“数据整合、智能分析、决策支持”三层能力体系,实现尽调流程数字化升级,为一线提效减负,旨在促进金融产品和服务创新,提升服务实体经济质效,以金融创新驱动高质量发展。
多渠道数据整合:集成来自政府公开渠道、信用评级机构、行业协会和社会公众媒体等多个外部数据源,主要为税务信息、发票数据、征信数据等授权数据,工商信息、司法信息、知识产权、招中标信息、舆情信息等公开数据;充分与行内数据进行整合,主要为信贷业务数据、行为数据、交易数据、财务数据等;确保信息的全面性和实时性。在数据整合过程中,对不同来源的数据进行清洗、标准化处理,消除数据冗余、重复和错误,确保数据质量。通过高性能的数据处理引擎,支持并行计算和分布式数据处理,能够同时分析多条数据流,显著提升数据处理的速度,使得客户经理可以在最短时间内获得分析结果。
数据分析与客户画像:在信息整合和加工共享的基础上,对客户信息和数据进行结构化处理与特征指标加工等深度挖掘与处理,依据行内风险偏好,设置百余个风险指标,对客户数据进行全面细致的扫描,用于负面事件筛查。一旦发现潜在风险点,系统会迅速输出详细的筛查结果,包括风险类型、风险程度以及可能产生的影响等信息。同时,基于专业的风险评估模型和丰富的业务经验,系统还会给出针对性的行动建议,如进一步核实某项信息、调整授信额度或采取相应的风险防范措施等,真正实现了风险管理的前置。在风险筛查的同时,借助大数据技术,系统将为客户生成全方位360 画像。这一画像不仅仅局限于客户的基本信息,如企业名称、注册地址、法定代表人等,还深入挖掘客户的关联信息,包括股权关系、上下游供应链关系、担保关系等,清晰呈现企业在市场网络中的位置和影响力。对于财务风险,通过对财务数据的深度分析和模型预测,评估企业的财务健康状况,预测潜在的财务危机。在经营模式方面,结合企业的业务流程、市场定位、销售渠道等信息,剖析其经营模式的优势与潜在风险。此外,利用自然语言处理技术对海量的行业舆情数据进行分析,及时掌握行业动态、竞争对手情况以及企业自身的口碑评价,为银行提供全面、立体的客户视角。
量化模型支撑智能决策:探索以“数据 + 算法”驱动,结合大数据、机器学习和决策引擎等前沿技术,应用于精准营销和风控决策等场景。为了更精准地衡量各因素对企业风险的影响程度,系统借助数据分析技术,基于行内风险偏好,结合企业财务指标、经营绩效评估、信用历史与行为分析、行业与市场环境分析等多维画像,将各个指标的权重和影响力进行量化。在此基础上,系统精心构建了四大决策模型,分别为产业分析模型、客群挖掘模型、量化评估模型和企业综合评分模型。产业分析模型通过对大量行业数据的深度挖掘和分析,把握不同产业的发展脉络、周期特点以及竞争态势。它能够预测产业的未来走向,帮助银行提前布局,优化信贷资源在不同产业间的配置,避免因产业系统性风险导致的信贷损失。客群挖掘模型利用机器学习算法,对海量客户数据进行聚类分析和特征提取,它能够发现不同客户群体的潜在需求、行为模式和风险特征,帮助银行精准定位目标客户群体,实现差异化营销策略。量化评估模型运用复杂的数学模型和统计方法,对企业的各项风险因素进行量化计算,它综合考虑企业的财务风险、经营风险、市场风险等多个方面,为企业的风险状况提供一个精确的量化评估结果。企业综合评分模型则是在前述三个模型的基础上,对企业的综合实力和信用状况进行全面评价。它将各个维度的评估结果进行整合,通过历史数据的训练,不断优化模型的参数和算法,提高模型的精准度和业务可解释性。经过反复训练和验证,该模型能够精准地计算出企业的综合能力评分,这一评分全面反映了企业的综合实力和信用状况。客户经理可以依据这一评分,快速、准确地了解企业的基本情况,为其提供精准的企业能力评价,从而在信贷业务中做出更明智的决策,如确定合理的授信额度、贷款期限和利率等。
基于AI 自动生成尽调报告:通过梳理行内不同行业、不同产品的业务尽职调查模板,形成预设的报告模板,基于自然语言处理技术,将尽调报告自动生成结构清晰、逻辑连贯的报告框架和内容。报告涵盖了企业经营分析、行业分析、财务分析、风险缓释措施等多个方面,支持将报告输出为 Word 格式,方便用户进行保存和编辑。此外,还可以根据数据情况实现报告的实时更新,确保数据的时效性和准确性,满足银行对于尽调报告的全面要求。
分布式数据湖结构:数据融合与价值挖掘的基石分布式数据湖架构在数智尽调平台中处于关键地位,它搭建起跨平台、多模态的数据治理中枢,为全域数据融合与价值挖掘创造了条件。通过引入CDC(Change Data Capture)技术和高可用部署体系,平台能够实时同步行内业务数据,确保数据的时效性与准确性,让银行在尽调时获取的信息始终贴近企业运营实际情况。从数据存储层面看,分布式数据湖采用混合存储策略。对于结构化数据,如企业交易流水,平台运用列式压缩存储和增量更新技术,既减少了存储空间占用,又能快速处理新增数据,提升数据查询和分析效率。对于非结构化数据,像抵押物扫描件、尽调录音等,平台实施对象存储并进行元数据标签化处理,借助 NLP 技术将尽调笔记转化为可检索的知识节点,便于后续深度挖掘和利用。凭借统一的数据目录服务和细粒度权限控制机制,分布式数据湖不仅满足了银行合规审计的要求,还为智能信贷决策提供了坚实的数据支撑。在实时风险预警场景中,系统能依据整合后的数据,迅速发现企业异常交易行为;在关联交易穿透分析时,可清晰呈现复杂的企业关联关系,助力银行全面把控风险。
自然语言处理(NLP)技术:赋予数智尽调平台理解和处理自然语言的能力,实现从形式化文本分析到语义深层次理解的跨越。在词法分析环节,平台借助 工具进行分词、词性标注和命名实体识别,精准提取文本中的关键信息。例如,从企业新闻报道中识别出企业名称、相关人物、事件等实体。句法解析阶段,利用隐马尔可夫 HMM 模型等传统算法和 CKY 算法,平台对句子结构进行拆解分析,理解文本的语法结构和语义关系,为后续的语义理解和逻辑推理奠定了基础。通过预训练语言模型 Masked Language Modeling 和逻辑推理框架算法Neural Theorem Prover,平台实现动态语义理解和篇章结构推理,能够深入解读文本背后的含义和意图。在数智尽调中,NLP 技术与语音识别、语音合成、视觉问答等多模态技术协同工作,对企业司法、舆情等非结构化数据进行情感解析时,NLP 技术可判断出文本的情感倾向,帮助银行发现潜在风险点。若大量舆情信息对企业持负面评价,可能暗示企业存在声誉风险,提醒银行在尽调时重点关注。
知识图谱技术:构建企业关系全景图,知识图谱以图形化的方式呈现企业实体、事件及其之间的关系,为数智尽调平台提供了一种全新的数据分析和理解方式。我行建立的图分析平台,当前采用ArangoDB 数据库,兼有 key/value 键 / 值对、graph 图和document 文档数据模型,基于其本地集成的多模型特性,搭建高性能程序,支持灵活的可视化效果配置,包括实体、边的可视化效果展示,可支持 K 层展开、最短路径、全路径,也可通过自定义图查询语句进行图查询的GQL 功能。借助图分析平台的标准化、自动化、灵活化,搭建风控应用场景,充分发挥知识图谱的价值。基于知识图谱技术,平台深度挖掘企业全方位的关联关系,包括股权、人事、担保、资金交易等多种关系类型,并穿透式地分析实际控制人、一致行动人等关键关系。有助于全面了解企业的背景和潜在风险。在评估企业信用风险时,若发现企业与高风险企业存在紧密的股权关联或频繁的资金往来,可提前做好风险防范措施。通过聚类、分类等手段,平台对全量企业客户进行分群和群体特征分析,挖掘企业客户群体风险形态,包括集团派系识别及风险洞察、担保圈链识别及风险洞察、黑名单关联族谱挖掘及风险洞察、信贷资金用途监测、企业风险传导监测等。在担保圈链识别及风险洞察场景中,平台能清晰展示担保圈内企业的相互关系,预测风险在圈内的传导路径,辅助评估关联授信整体风险,提前制定风险应对策略。
智能决策与风险预判的引擎:大模型贯穿于数智尽调平台的各个环节,为智能决策和风险预判提供了强大动力。基于多线性回归算法和半监督机器学习等技术,平台综合分析企业财务状况、宏观经济指标、行业舆情等多维数据,结合业务专家经验,量化不同行业景气度指数,推导产业链上下游行业风险传导的相关性。这使银行能够提前预判行业风险,调整信贷策略,优化资源配置。在财务分析方面,人工智能技术通过分析企业财务报表勾稽关系、数据变化情况,并与大量行外财务数据样本交叉验证。并创新性地采用动机分析识别方法,在基于财报完整性、平衡性及波动性分析等自下向上的传统方法基础上,从企业造假动机出发自上向下建立指标联动,构建财务分析模型。该模型能有效识别企业财务造假行为,提高风险评估的准确性。
在优化信贷业务流程方面:数智尽调功能通过同步业务流程、线上智能生成尽调报告,解决了以往尽职调查靠手工耗时费力等痛点。智能生成尽调报告上百份,平均报告自动化完成率高达60%,为客户经理提效减负,为评审与贷后管理提质增效,同时大幅提升了企业融资效率和客户体验。
在提升尽调质量方面:通过对企业所在行业的发展情况、企业资质、财务情况的智能分析,辅助客户经理提供更加全面和准确的企业尽调报告,为后续的审批决策打下坚实的基础,提升评审人员贷中审核效率,提升信贷风险管理质量。
在支持新兴产业发展方面:数智尽调平台辅助将信贷资金投向新兴产业,从金融供给侧有效助力地方重点产业高质量发展。例如,在支持某新兴科技企业的过程中,平台通过对企业的技术创新能力、市场竞争力、财务状况等进行全面评估,为银行提供了准确的风险评估和授信建议,帮助企业获得了所需的信贷资金,推动了企业的快速发展。
减少数据处理时间:传统尽调模式下,数据处理工作繁琐且耗时,业务人员需要花费大量时间收集、整理和分析数据。数智尽调平台通过高性能的数据处理引擎,实现了数据的自动化采集、清洗和分析,大大缩短了数据处理时间。平台能够同时分析多条数据流,快速生成数据分析结果,使业务人员能够在最短时间内获取全面、准确的企业信息,为决策提供有力支持。例如,在进行一笔大额信贷业务的尽职调查时,传统方式可能需要数天甚至数周的时间来收集和分析数据,而数智尽调平台可以在几个小时内完成数据处理工作,大大提高了工作效率。
提高风险识别能力:数智尽调平台借助先进的技术手段,能够从海量数据中精准识别风险点,为业务人员提供全面、深入的风险分析报告。知识图谱技术和人工智能技术的应用,使平台能够挖掘出企业之间隐藏的关联关系和潜在风险,提高风险识别的准确性和及时性。业务人员可以根据平台提供的风险提示,提前制定风险防范措施,降低信贷风险。例如,在识别企业的欺诈风险时,平台可以通过分析企业的交易流水、关联方关系、财务数据等多维度信息,利用机器学习算法构建欺诈风险模型,及时发现异常交易和潜在欺诈行为,为银行资金安全提供保障。
简化报告撰写流程:传统的尽调报告撰写工作需要业务人员耗费大量时间和精力,且报告质量容易受到个人经验和能力的影响。数智尽调平台通过自然语言处理技术,自动生成结构清晰、逻辑连贯的尽调报告。平台根据预设的报告模板,将分析结果转化为规范的报告内容,涵盖企业经营情况分析、所在行业分析、财务分析、风险缓释措施等多个方面,并支持将报告输出为Word 格式,方便用户进行保存和编辑。业务人员只需对报告进行审核和补充,即可完成报告撰写工作,大大简化了报告撰写流程,提高了工作效率和报告质量。
社会效益:一是推动实体经济发展,通过构建本平台,促使银行不断创新金融产品和服务模式,开发出更符合市场需求的个性化产品使得金融服务精准支持实体经济发展的重要领域和薄弱环节,为实体经济发展提质增效。二是提高社会资源分配效率,通过海量数据分析,精准评估企业价值和风险,使银行的资金能够更精准地流向优质企业和项目。有助于提高社会资金的使用效率,避免资金错配,促进资源向更有潜力和价值的领域流动。
从项目建设流程来看,可在需求顶层设计、技术架构选型、数据治理三个方面总结经验。在需求设计时,应当重点关注痛点精准识别,通过深度调研一线业务人员需求,明确尽调场景核心痛点,包括多元数据整合困难、报告撰写耗时、风险识别遗漏等问题。在项目管理方面,应注意分阶段规划目标,形成“短期试点 - 中期扩展 - 长期深化”的实施路径。在技术架构和选型方面,可采用“大模型 + 小模型”的组合方案,根据尽调模块特征,选择能力适配的模型。在数据治理及安全保障方面,根据调查报告撰写要素构建结构化知识库,同时通过联邦学习、动态脱敏等技术确保数据不出行,保障数据安全。
在应用推广方面,可构建场景验证和敏捷迭代的推广策略。场景化试点方面,在产品选择上,可优先选择标准化程度高的业务场景进行试点,如小微企业贷款。在试点机构选择上,可优先选择业务量大、具有一定数字化转型思维的机构展开试点,收集足量样本,为后续优化迭代做准备。在敏捷迭代方面,构建快速反馈优化机制。以两周为周期收集用户反馈,持续迭代系统功能,保证系统正常运行。
近年来,国家金融监管总局持续强化操作风险管理要求,明确提出金融机构需深化风险工具联动应用,实现“风险识别 - 评估 - 监测 - 整改”全链条闭环管理。《银行保险机构操作风险管理办法》强调,应通过整合 RCSA(风险与控制自评估)、KRI(关键风险指标)、LDC(损失数据收集)三大工具,构建多维风险视图,提升风险防控的协同性与前瞻性。
基于监管导向与行业趋势,针对传统风险管理中存在的数据孤岛、基层触达弱、响应滞后等痛点,启动“智能生态 + 大模型”数字化闭环体系建设。以智能风险管理(IRC)系统为核心载体,响应监管对“工具联动、穿透管理”的要求,率先探索“AI 大模型 + 风险工具联动”模式,着力解决三大核心问题。一是风险工具割裂,RCSA、KRI、LDC 独立运行,数据无法交叉验证,风险信号碎片化;二是基层风险盲区,总省两级监控难以覆盖地市、县区及网点末梢,风险识别颗粒度不足;三是处置效率低下,人工依赖度高,风险预警与整改脱节,难以满足监管“T+1”时效要求。
通过“技术重构 + 管理革新”双轮驱动,攻克保险业数据孤岛、基层触达滞后、动态响应薄弱三大痛点,以“大模型 + 智能生态”为核心,构建 CSA-KRI-LDC 立体化联动模型,实现风险防控能力跃升与行业范式升级,兼具创新性、实用性和可推广性。
“智能生态 + 大模型”协同模式:突破传统风控技术工具化局限,首次将 AI 大模型与风险监测、预警、评估等系统深度融合,构建覆盖预警、评级、偿付能力管理等全场景智能生态体系,实现风险管理从“被动响应”向“多维前置管控”跃迁。研发保险风控领域专用生成式 AI 技术,搭建风险管理知识库,实现全量数据秒级精准查询,突破传统人工查询效率瓶颈,显著提升数据应用价值。
管理机制:T+1 动态风控网与五级监测体系。创新构建覆盖“总 - 省 - 地市 - 市县 - 网点”五级监测网络,实现 36 个 KRI指标 T+1 时效预警全国覆盖,结合数据标签化与可视化技术,为基层提供实时风险画像,将监管“早识别、早预警”要求转化为量化操作标准,推动风险治理颗粒度下沉至业务末梢。
RCSA-KRI-LDC 立体化联动模型:通过预设阈值与事件关联规则,实现数据交叉验证与风险信号智能推送,满足监管对工具协同的要求;依托动态风险指标体系,将 KRI 监测延伸至网点层级,确保五级机构风险偏好一致性。集成 AI 大模型与专用知识库,实现风险数据秒级定位、归因解析及处置建议生成,推动风险处置从“人工研判”向“智能决策”升级;搭建“总 - 省 - 地市 - 市县 - 网点”五级穿透式监测网络,风险识别颗粒度细化至末梢流程,提前拦截潜在风险。通过联动看板实时展示工具交叉验证结果,支持风险点分类管理与流程地图一键生成,实现可视化穿透分析;建立“识别 - 评估 - 预警 - 整改 - 报告”全流程闭环,整改响应时效压缩至 24 小时内,推动风险管理从“分散式事后处置”向“集约化前置管控”转型,对标行业领先实践。
智能风险管理(IRC)系统架构:采用分层解耦架构设计理念,构建起功能架构 - 技术架构 - 部署架构的三维协同体系。在功能架构层面,通过业务模块化设计与标准化接口封装,实现风险识别 - 评估 - 监测 - 整改的全流程闭环管理;技术架构依托微服务框架与分布式计算引擎,保障实时决策引擎的高并发处理能力;部署架构采用容器化编排与自动化运维平台,支持混合云环境下的弹性伸缩与灰度发布。通过架构间的分层治理与松耦合集成,最终达成应用层人机交互敏捷高效、服务层业务逻辑精准执行、基础设施层资源调度稳健可靠的立体化建设目标,为金融机构实现风险防控数字化转型提供全栈式技术底座。
全流程数字化闭环:通过自主研发深度融合风险管理工作需求,打造了覆盖风险识别、评估、预警、处置、整改的完整数字化闭环。该体系突破性地解决了保险业长期存在的“线下手工操作 - 线上碎片化管理”割裂问题,实现风险事件上报时效从72 小时压缩至 12 小时。特别是在操作风险应对领域,系统通过规则模型的实时查询,填补了系统性线上风控的空白。完成风险管理“大模型 + 智能生态”的协同模式落地,实现对企业发展过程中面临的风险隐患进行多维前置管控。
数据穿透可视化:构建了行业“总 - 省 - 地市 - 市县 - 网点”五级穿透式监测网络,突破传统机构层级的平面化监控模式,将风险定位精度提升至网点级颗粒度。配套开发的“机构风险全景图”等可视化看板,运用动态流数据处理技术,实现各机构层级、上万个网点的实时风险态势投射,支持管理者在短时间内完成区域性风险点的有效定位,推动行业风险治理进入“细胞级”管理时代,进一步提升风险管理智能支撑水平。监测数据时效实现 T+1,网点级别 KRI 指标达 36 个,赋能省分机构实现风险“早识别、早干预”。
生态化平台集成:成功实现与整合风险预警(KRI)、操作风险与控制自评估(RCSA)、操作风险管控(LDC)等 12 个核心子系统的深度整合,构建了日均处理量达百万条的智能风控中枢。率先探索 AI 生成式大模型在风险垂直领域的应用,突破传统风控数据孤岛的瓶颈,该项技术在行业处于先进水平,以“数据直达、智能直达”的实践成果,研发的“风控认知智能引擎”实现语义解析准确率达 90% 以上,风险决策响应速度提升至秒级,标志着保险业正式进入风险认知智能决策阶段。
构建五级监测体系,KRI 指标 T+1 预警覆盖全国网点,风险识别效率提升 200%;LDC 事件全流程线上化,智能表单替代人工填报,数据收集效率提升 150%;RCSA 评估自动关联风险点与责任部门,整改任务一键生成,操作风险评估效率提升 120%。通过标签化、可视化与自动化联动,实现“监测 - 处置 - 优化”闭环提速,推动管理下沉与业务高效运转。通过数据穿透、智能预警与动态决策,推动风险管理从“被动响应”向“主动防控”转型。
“智能生态 + 大模型”操作风险联防项目的成功实践,为金融业风险管理数字化转型提供了可复用的方法论:一是以“监管导向 + 痛点攻坚”双轮驱动,精准定位数据孤岛、基层触达弱、响应滞后三大行业痛点,通过技术重构与管理革新协同发力,构建覆盖“总 - 省 - 地市 - 市县 - 网点”五级穿透式风控网络,将监管要求转化为量化操作标准;二是“分阶段 + 模块化”实施策略,采用瀑布模型与敏捷开发融合的交付模式,通过需求优先级矩阵与 DevOps 持续集成,严控技术债务的同时实现核心功能快速上线;三是“用户中心 + 生态协同”设计理念,以基层需求为导向,通过 AI 大模型与 RCSA-KRI-LDC 联动模型,实现风险数据秒级定位,推动风险处置从人工研判向智能决策升级;四是“数据直达 + 分级赋能”运营机制,构建五级权限管理体系与可视化穿透看板,通过标签化、自动化技术实现风险信息精准推送,保障总省至末梢机构风险偏好一致性。项目验证了“技术 + 管理 + 生态”三位一体的风控范式升级路径,为行业提供了从工具协同、流程重塑到智能跃迁的完整解决方案。
党的十八届三中全会以来,党中央在以习近平同志为核心的党中央团结带领全党全军全国各族人民,持续从社会主义市场经济体制、经济高质量发展体制、创新体制机制、经济治理体系等多方面通过建立和健全制度体系、进一步深化各项改革措施。为此,针对金融行业,党中央和国家监管机构也在各类管理措施中,明确加强了银行金融机构对内控合规制度管理体系的要求:“及时、动态地将监管规定转化为内部规章制度”、“要把合规性审核作为制定或修订内部重要制度的必经程序”、“要强化管理制度化、制度流程化、流程信息化的内控理念,将各项业务制度的合规管理要求嵌入业务流程中”。2024 年的政府工作报告中也明确提出“深化大数据、人工智能等研发应用,开展‘人工智能 +’行动”。国家金融监督管理总局令 2024 年第 7 号公布了《金融机构合规管理办法》,将于 2025 年 3 月 1 日正式实施。此举标志着我国金融业合规管理迈入了一个新的阶段,具有里程碑意义。
面对党中央、监管机构持续加强针对金融机构的风险整治和管理力度,银行机构在合规管理方面面临巨大挑战,合规成本投入不断增加。当前信息时代正在加快进入银行合规内控的发展阶段,伴随着以大数据、人工智能(AI)、ChatGPT 等为代表的信息技术的高速发展,为合规内控管理提供了新的手段与方法,人工智能技术上的突破层出不穷,逐渐深入地赋能千行百业,推动人工智能要素已成为新质生产力的典型代表。
在此背景下,银行通过引入和合信诺“AI 合规官”领先解决方案,打造横向到边、纵向到底的数智化监管合规管理体系,将合规基因注入银行发展决策、业务经营的全过程、全领域。
例如,在外规监管制度跟踪过程中,通过“AI 合规官”可以实现监管法规政策条款的自动化拆解,完成对制度层级以及条款层级的自动化打标签,从而实现监管政策解读以及要求从文本内容向条款化、结构化转化的过程。此外,可按照最新的监管法规政策要求,自动化沉淀一套监管的红线合规要求,突破了以前需要人工整理监管要求的做法,为后续开展监管检查提供了精准的相关检查线索,大幅提升了监管合规管理效率。
此外,银行“AI 合规官”解决方案,搭载了全球领先 copilot 智能合规 AI 助手,可提供智能合规问答、法规政策智能问答、制度规范性和一致性智能审查、多知识库智能问答、长报告 / 法规政策快速解读等诸多实用和创新功能,大幅提升合规管理工作的效率、降低运营成本,真正达成降本增效的业务目标和数智化监管合规的高质量发展目标。
方案概述:全栈支持信创,架构先进、可拓展性、兼容性好、适用性、稳定性、安全性强;基于DeepSeek 等大模型技术的创新合规管理工具,助力银行实现合规管理效率的大幅提升;方案对齐监管规则和要求,稀缺性价值高,以数智驱动管理思路,形成超越流程管理的领先数智化监管合规管理;用户交互体验更友好,利用智能化技术手段大幅降低了用户使用的困难度,让系统更好用,用户愿意用; 为一线用户减负赋能,提供一系列 AI 合规助手和工具,实现智能化辅助支持高效工作。
方案规划:与银行战略重点、技术升级和合规管理流程紧密联系,通过以DeepSeek 大模型一体机为核心底座、软硬件的深度融合与优化,旨在打造以“监管法规”为核心,以“数智化”为手段、以畅通“制度传导”为主要目的“合规内控生态圈”,通过引入大语言模型及 AI 技术,对接内外部知识库、数据库,实现自然语言交互实时问答及回复监管合规领域相关问题等,具备高效性、准确性、个性化、安全性以及低成本特点。
项目应用:覆盖银行各相关业务部门,为用户提供高效、可靠的监管政策法规咨询和分析服务,有效支持业务开展,得到了全行用户广泛认可。对于银行业内其他正在寻求转型或准备转型的机构具有很大的启发和借鉴意义。
体现了数智化合规管理对业务发展的全面支持,通过迭代传统合规管理手段和做法,构建科学、智能、有效的合规管理架构和AI 工具,实时跟踪监管政策变化,并赋能一线业务,有效提升数智化水平及工作效率、提升合规风险监测、预警及治理能力,确保银行合规管理始终符合最新监管要求,加快实现从“被动监管遵循”向“主动合规治理”的转变,推动银行法治建设和高质量发展。
加强企业合规管理,提高依法合规经营水平不是单一搭建数字化、智能化信息系统和工具这么简单。它是一项企业级工作,需要整体布局规划,包括业务流程的优化、业务系统的管控改造、全面的数据治理。高层真正地重视是成功的关键。
数智化合规管理项目不能烟囱式建设,一定要打通底层数据,这样才能够做到口径统一,数出一致,也为未来灵活扩展和进一步深化在AI+ 法律、AI+ 合规、AI+ 内控、AI+ 风险、AI+ 审计等高价值及复杂场景的应用奠定基础。
合规治理数智化不是一蹴而就的,它是个持续工程,需要长期坚持不懈。坚持以用提质,数据的质量是在高频的使用中得到提升的。在数智化金融监管趋势下,银行将持续加强合规管理体系和能力建设,不断提升监管合规管理质量和效率,深化锻造数智化能力,赋能公司业务稳定、健康和高质量发展。
在金融监管政策持续加码、合规要求日益精细化的背景下,监管机构明确将数字化转型作为提升合规管理质效的核心路径。国家金融监督管理总局2025 年 3 月施行的《金融机构合规管理办法》强调“充分运用数字化、智能化手段提升合规管理的实时性与精准性”,人民银行《金融科技发展规划(2022-2025 年)》明确提出“探索人工智能、大数据、区块链等技术在风险防控、合规管理中的深度应用,构建智能化风控模型与动态合规监测体系”。面对银行业制度库中海量制度条文,传统检索因效率低、时效性差、解读碎片化等问题,已难以满足 “实时响应、精准识别” 的要求。在此政策框架下,建设智能化合规工具成为金融机构应对监管趋严与业务敏捷发展双重挑战的必然选择。
随着银行数字化业务场景的持续拓展,高频次的监管政策迭代与复杂化的业务合规需求,对传统合规服务模式形成显著挑战。业务部门对制度查询的实时性、多维度关联解读需求日益迫切,而传统查询模式效率、人力瓶颈逐步凸显。在此背景下,银行聚焦合规管理数字化升级,依托大模型技术的语义理解能力与RAG 技术的知识检索优势,打造 “智慧合规助手”, 构建“检索 - 生成 - 校验”一体化智能引擎。通过精准匹配制度条文与智能化解读输出,在提升合规响应效率的同时强化风险管控能力,推动合规服务向精准化、标准化、可溯化的新模式升级。
深度融合RAG技术:基于行内大模型,深度融合 RAG 技术实现制度库的动态检索与智能问答,有效突破传统检索模式效率瓶颈。通过自建政策知识库的动态维护机制,实时整合最新制度文本,采用“向量检索 + 语义增强”双引擎技术,将非结构化制度文本转化为高精度语义向量,在问答过程中实时注入最新制度内容,既保留了大模型的自然语言理解优势,又通过结构化知识锚定有效抑制模型幻觉问题。系统特别强化了多轮对话与上下文关联分析能力,可精准解析复杂业务场景中的隐含合规诉求,例如跨章节制度关联、模糊条款解释等场景,确保输出的每个合规结论都严格遵循现行有效制度规范。
交互优化与效能监测:系统提供多维度交互分析看板,支持实时查看问答日志、标注关键会话案例,并内置性能监测模块统计日活用户量、平均响应时长等核心指标。管理人员可通过可视化界面分析高频咨询话题分布,识别政策盲区或表述模糊条款,手动调整模型检索权重或补充标注数据。通过会话日志记录高频咨询要点,为人工优化模型提供数据支撑。针对复杂政策咨询场景,系统提供人工标注工具,支持对模型输出的条款匹配度进行分级标记,沉淀的标注数据集将用于定向优化检索模型效果。
智能辅助与精准推荐:系统创新设计政策关联推荐功能,在回答用户提问时自动呈现相关度较高的关联条款,推荐依据来源于历史会话的共现分析和政策文本的语义关联。对于高频咨询的共性政策问题,支持管理人员手动配置标准解读模板,当检测到同类问题时优先调用预设解读方案,提升响应一致性与准确性。通过分析用户历史咨询记录和岗位特征,主动推送关联度高的制度条款和典型案例,实现合规服务从“人找知识”向“知识找人”的范式转变。
平台架构:智慧合规助手是以大模型与RAG 技术为核心,结合银行业合规管理需求构建的智能问答服务平台。平台集成制度动态检索、多轮对话理解、人工标注优化、效能监测等核心模块,自建知识库精准检索关联制度条文,支持政策文本向量化存储与语义检索,确保合规回答的准确性与时效性。基于“大模型 + 人工校验”的双重机制,建立覆盖问答全流程的闭环管理,包括会话日志记录、高频问题分析、人工标注反馈等环节,形成“检索-响应-优化”的可持续改进体系,助力合规服务从传统人工查询向智能辅助决策转型,提升合规响应效率与风险防控能力。智慧合规助手采用轻量化微服务架构,实现大模型推理与 RAG 引擎的融合部署,集成政策文本向量化引擎、多轮对话管理模块、人工标注工具及效能分析看板。内置会话日志系统记录用户咨询详情与模型响应数据,支持人工标注关键案例并反哺检索模型优化。质量管理方面,构建覆盖制度匹配准确率、响应时效、人工干预率的多维度评估指标,结合可视化看板动态监测日活用户量、会话峰值等运行状态。同时,与行内日志管理系统、用户权限管理体系无缝集成,确保服务合规性与数据安全性,为全行提供高效、可控的智能合规支持。
通过建设智慧合规助手,将制度检索、智能问答与服务优化流程深度融合,实现合规咨询服务的标准化管理与智能化升级。目前,该平台已覆盖多个主要业务条线的日常合规需求,支持复杂场景下的多轮对话交互与政策精准匹配,显著缩短人工查询制度的时间成本。通过持续优化语义理解算法与人工标注反馈机制,有效降低条款误读风险,提升合规应答的准确性与权威性。系统运行期间积累的对话日志与用户行为数据,为识别制度盲区、优化服务流程提供实证依据,逐步形成“智能响应 - 人工校验 - 知识迭代”的良性循环机制,为全行合规管理数字化转型奠定实践基础。
提升合规服务效率。通过智能问答与精准检索技术,显著缩短人工查询制度的时间成本,减少重复性工作投入,加速业务决策流程。
优化人力资源配置。自动化问答服务与高频问题沉淀功能,释放合规人员基础查询压力,使其聚焦于复杂场景分析与风险研判,提升专业价值产出。
增强业务敏捷性。通过快速响应制度咨询需求,支持业务部门及时把握合规边界,缩短新产品、新业务的合规评估周期,助力业务创新落地。
推动合规管理数字化转型。构建智能化合规服务模式,为银行业探索人机协同的合规管理体系提供实践范例,促进行业合规服务标准化进程。
强化风险防控能力。通过精准解读与动态更新的制度服务,提升全行合规执行力,增强金融业务规范性,助力维护区域金融稳定。
培养“业务 + 技术”复合人才。系统建设与优化过程中,推动合规团队掌握智能工具应用与数据分析能力,培育兼具制度解读与技术思维的复合型人才梯队。
项目启动阶段需立足合规管理本质,优先建立“制度解读标准化”体系。通过全面梳理行内制度库结构与业务场景关联性,明确智能问答服务边界与责任归属,制定标注标准、响应分级、人工校验等全流程规范。重点固化制度检索优先级规则与模糊条款处置机制,确保智能应答既符合技术逻辑,又严格遵循行内合规管理要求,为服务可控性奠定基础。
推广策略需兼顾服务价值与实施可行性,分层次推进能力覆盖:优先选择业务影响面广、技术实现复杂度低的场景建立服务标杆,通过标杆案例沉淀标准化实施模板;随后延伸至低频但规则明确的场景,依托既有经验加速复制;对跨系统协同、高复杂度场景,采用“业务专家 + 技术团队”联合攻坚模式,逐步突破技术瓶颈;针对投入产出比低的边缘场景,建立动态评估机制,聚焦资源优先保障核心服务能力迭代。
构建覆盖问答全链路的量化评估体系,持续追踪制度匹配准确率、响应时效、人工干预率等核心指标,结合满意度反馈与标注数据分析服务短板。通过高频问题聚类识别制度盲区,利用误判案例逆向优化语义检索模型,形成“数据采集 - 问题归因 - 策略优化”的闭环管理。定期输出服务效能报告,为制度库更新、功能迭代提供决策依据,推动智能合规服务从经验驱动向数据驱动的精细化运营转型。
近年来,网络查控业务量迅猛增长,传统人工审核模式在处理效率与操作风险防控方面已难以满足实际需求。同时,业务的快速发展也对事后质检覆盖度和实时风险干预能力提出了更高要求。为应对挑战,银行立足“数智化运营”体系建设,依托人工智能技术,打造集实时监测、智能审核、精准质检于一体的网络司法查控AI管理体系。项目旨在通过科技赋能,全面提升司法查控业务的处理效能与风险防控水平,构建“覆盖全流程、管控全链条、响应全时段”的新型业务模式,为有权机关高效、合规开展司法查控工作提供坚实服务支撑。
“法眼洞察”智能监控机制:为全面提升网络司法查控业务的安全性与稳定性,搭建“系统 + 业务”双维度监控网络。系统层面,“法眼洞察”对各接入渠道的服务状态、接口响应及数据传输等关键环节进行实时监测,精准识别异常,保障平台稳定运行;业务层面,深度融合司法查控业务处理流程,动态追踪关键节点,如账户冻结失败、报文反馈失败等异常情况,实现自动识别、智能预警,并通过短信、系统通知等多渠道高效传递风险信息,显著提升应急响应效率,实现风险“自动识别 – 主动预警 - 快速处置”闭环,全面筑牢司法查控业务安全防线。
“智脑会审”AI 审核功能:司法文书审核是金融机构协助有权机关开展司法查控业务处理流程中的关键环节,银行依托“智能 OCR+DeepSeek”双引擎,构建起一套高效、精准、智能的司法文书自动审核体系。借助智能 OCR 技术实现对各类司法文书进行精准识别和内容提取,并利用 Deepseek 自然语言处理和深度语义分析能力,智能校验文书信息的准确性与合规性,形成从精准文书识别、智能信息提取、深度内容分析到报文自动校验的全链条闭环处理机制,提升司法文书处理的智能化水平与风控能力。
“全控严检”业务质检机制:银行全面整合有权查控平台、企业知识平台及核心业务系统等多源异构数据,依托自主研发自动化质检程序,构建“全控严检”高效智能的校验机制。通过深度融合业务规则与监管要求,实现对全量网络司法控制类业务处置结果与反馈信息的自动核验,针对程序标记的异常数据,采用“机器初筛 + 人工复核”机制,全面重构网络司法查控业务的质检体系,提升质检覆盖面与效率,强化业务数据的完整性、准确性与合规性管理。
风控模式革新:建立“法眼洞察”实时异常监测机制,覆盖 40 余类异常场景,7×24 小时实时监测系统运行与业务流程,精准识别异常情况并主动预警,借助短信、系统通知等多渠道 , 确保风险信息第一时间触达责任人,大幅提升应急响应效率,推动风控模式向“主动干预”转变。
审核技术突破:“智脑会审”依托“智能 OCR+DeepSeek”双引擎,实现从精准文书识别、智能信息提取、深度内容分析到报文自动校验的全链条闭环处理,全面革新文书审核模式,审核效率提升 97%,人工干预需求大幅降低。
质检体系升级:全面整合多源数据,借助自动化质检程序对业务进行“全控严检”,将传统人工抽检模式升级为 100% 全量自动化检测,结合“机审 + 人核”双轨机制,质检效率提升 93%,升级重构了网络司法查控业务处理的事后监督模式。
智能网络司法查控管理体系上线以来已取得显著成效。在异常检测方面,已覆盖接口异常、控制处理报错等40 余类场景,贯穿业务接收、解析、处理及上报各环节,全面嵌入系统运行与业务处理全流程;在 AI 文书审核方面,月均处理量超 2 万笔,审核准确率达 97.8%,人工审核量下降 85%。在智能质检方面,质检覆盖率由原 10% 提升至 100%,质检效率提升 93%,大幅提升了业务处理的高效性与合规性,为网络司法查控业务稳健运行提供了有力保障。
在经济效益方面,通过构建实时异常检测机制,系统响应与处置能力显著提升,有效防范因处理滞后带来的经济损失;同时,依托智能化体系建设,业务运营效率持续优化,月均处理量突破万笔,审核准确率达97.8%,节约人力成本约 35 人。在社会效益方面,“三位一体”智能支撑体系的建立,显著缩短了业务响应周期,全面提升了服务专业度与业务响应效能。
当前,金融科技已成为驱动金融创新的核心引擎。本项目是将DeepSeek大模型应用于业务流程中,通过深入调研智能化应用场景,精准识别业务痛点,依托 AI 技术与业务规则的深度融合,成功构建了“事前—事中—事后”全周期风控闭环。项目建设过程中,“业技术”敏捷小组高效协同,在场景梳理、规则制定及系统优化等关键环节发挥了重要作用,显著提升了我行在网络司法查控业务领域的处理能力与响应效率。项目的成功落地,标志着人工智能技术在金融业务流程中的深度应用,充分体现了技术赋能业务的战略价值。同时,跨部门协作机制凝聚了集体智慧,形成了可复制、可推广的“银行方案”,为行业智能化转型提供了有益借鉴。
随着金融行业数字化转型加速,各机构面临海量非结构化文档治理难题。据行业调研显示,头部金融机构年均产生技术文档超50 万份,但知识利用率不足 35%。传统基于关键词检索方式的知识管理系统存在如下痛点,语义理解能力薄弱导致召回率低下,知识更新滞后造成维护成本高企,敏感数据外泄风险制约智能化进程。本项目创新性地提出“分布式大模型 + 智能知识管理”双轮驱动方案,通过本地化部署满足金融级安全要求,采用RAG 技术实现动态知识更新,结合深度语义理解突破复杂场景应用瓶颈。技术架构设计重点攻克多源异构文档处理、检索性能优化、基础环境性能及稳定性等核心问题,为行业知识管理范式转型提供可复用的解决方案。
技术维度:
1. 采用“大模型分布式推理 + 知识管理流水线”融合架构,通过 vLLM 框架实现百亿参数模型在国产化硬件环境的高效集群部署,推理资源利用率达 78%。
2. 研发面向金融文档的动态分块算法,通过对 RagFlow 二次开发改造,使之深度融合 MinerU 智能解析引擎与动态分块策略,构建了面向复杂文档的智能分块体系。针对非常规复杂格式文档的特点,引入 LlamaIndex 框架实现定制化的文档分析和分块,提升分块的合理性及效率。
3. 构建基于多阶段重排序的混合检索体系,通过混合检索双路召回与深度精排模型组合,实现金融领域查询MRR 指标行业领先。
4.构建幻觉抑制体系。一方面,为控制生成答案的质量,配置拒绝回答阈值。当生成答案的可信度低于设定阈值时,系统拒绝输出答案,避免生成低质量或不准确的内容。另一方面,采用检索置信度评分、LLM 事实核查双重验证、提词器控制等机制,相较于传统 RAG 方案,幻觉率降低了 42%,有效提升了生成内容的质量。
应用维度:
1. 打造 " 知识即服务 " 新模式,通过 API 网关将各类知识库能力注入 OA、ITIL 等多个业务系统,统一接入与标准化接口,降低平台集成复杂度。
2. 建设智能监控告警系统,基于故障事件智能关联处理方案,提升 ECC 故障排查处置效率。
3. 构建批量作业调度事件智能化发现与处置能力,提升批量作业调度任务故障排查处置效率。
4. 实现了文档数据的统一管理,该平台对文档的整个生命周期进行了系统化管理,不仅提升了文档的组织性和可访问性,还确保了信息的时效性和准确性,提升各类文档在存储、检索方面的便利性。系统拒绝输出答案,避免生成低质量或不准确的内容。另一方面,采用检索置信度评分、LLM 事实核查双重验证、提词器控制等机制,相较于传统 RAG 方案,幻觉率降低了 42%,有效提升了生成内容的质量。
文档解析技术:
经实际测试表明,RagFlow 自带的原生 DeepDoc 智能解析引擎在处理多层级嵌套的图文排版及复杂表格结构的 PDF 文档时,存在解析精度不足的问题,难以满足金融行业对非结构化数据的深度语义识别需求,基于此,亟须一种更优质的文档解析算法进行替代。经过对市面上常见开源文档解析引擎调研、分析、论证,最终确定了RagFlow 集成 MinerU 的文档解析管理方案。RagFlow 通过深度融合 MinerU 智能解析引擎与动态分块策略,构建了面向复杂文档的智能分块体系,在提升知识处理效率的同时保障了语义完整性。系统依托 MinerU 组件的多模态解析能力,结合 OCR 光学识别与版面分析技术,精准解构 PDF、扫描件等非结构化文档的图文布局,实现对表格、公式、多栏排版等复杂元素的上下文感知。在此基础上的动态分块机制采用双层驱动架构,预设模板库内置学术论文、法律合同、财务报表等 20 余种垂直领域的分块规则,通过语义边界检测自动匹配文档类型。用户自定义模块则支持块大小、重叠比例、特殊标记保留等参数灵活配置,辅以基于 Transformer 的语义完整性评估模型,动态优化分块颗粒度。
检索优化体系:
检索通过运用多路召回技术,结合关键词、语义以及知识图谱检索,实现全方位检索优化。同时,引入 Raptor分层摘要技术,采用树状分层摘要架构,从块级总结逐步构建到全局索引,显著提升检索效率与准确性。此外,通过调整 Rerank 模型权重,对检索结果的排序进行优化,从而提高检索结果的准确性和相关性。
支持批量知识加载与知识库灵活挂载:
在知识批量加载能力方面,RagFlow 通过 RESTful API 体系提供了工业级数据管道支持。其核心知识摄取接口采用分布式任务队列架构,支持 JSON/XML 标准格式的多模态数据流式上传,单次 API 调用可承载百万级文档片段的批量注入。在知识库动态挂载层面,RagFlow 基于 API Token 的弹性知识路由体系。每个知识库在创建时自动生成具有细粒度权限控制的访问令牌,支持通过 HTTP Header 进行动态绑定。这种设计使得单个推理接口可以实时切换多个知识源,为多租户和各类切换测试场景提供了原生支持。
数智化知识管理系统严格遵循业务场景需求导向原则,在需求调研、方案设计、系统开发及测试验证等全生命周期阶段与业务部门保持深度协同,通过精准对接业务流程痛点与知识应用场景实现技术方案的精准落地。日均知识检索及调用量约1200 笔次,业务连续性保障有效,获得了行内用户对知识获取效率提升的积极评价,同时通过建立常态化需求反馈机制持续收集具有建设性的功能优化建议,为后续敏捷迭代及服务能力升级提供了重要支撑。
在运营层面,技术文档处理效率提升4 倍,知识库更新周期从周级压缩至小时级。ECC 故障及批量作业调度任务故障排查处置效率显著提升,处置准确率从 85% 提升至95%,人为操作失误导致的事故减少 80%。业务端数据显示,通过集中管理和快速检索各类知识文档,员工可以快速获取所需信息,减少了资料收集时间;通过对内部经验和知识的有效管理,避免信息孤岛,提升行内的知识管理能力,促进知识共享,推动了全行业务效率的显著提升和管理水平的全面升级。此外,系统建设过程中培养多名复合型 AI 人才,也为金融行业智能化转型树立标杆。
项目的成功实施,使每个员工都能生产知识,获取经验;每个管理者,都能统计知识水平,掌握组织成长;每个组织,都能沉淀知识资产,提升协作效率。
本项目成功验证了“大模型 +RAG”技术在金融领域的落地可行性,尽管大模型参数规模不断增长,但 RAG 在成本、速度和准确性上仍具优势,尤其适用于海量数据和垂直领域,具有不可替代性。三个核心经验值得借鉴:
第一,知识管理体系建设需遵循“数据治理先行,智能应用渐进”原则,建立完善的文档质量管理体系;
第二,检索效果优化需要构建" 召回 - 排序 - 生成 " 的全链路评测机制,特别是在金融专业术语处理上需设计领域适配方案;
第三,大模型落地需与实际业务场景结合,确保技术能更好地为业务服务。
未来规划沿着三个方向深化,首先扩展多模态处理能力,实现图表、录音、视频等非文本知识的统一管理;其次探索小样本持续学习机制,构建自演进的知识服务体系;最后在推动国产化生态建设方面,完成从芯片层到应用层的全栈技术验证。
随着ChatGPT 4.0 的发布与流行,AI 大模型技术呈现快速发展趋势,国家宏观政策也鼓励金融机构进一步投入科技创新,以数智化转型增加金融服务的科技含量。面对新一轮人工智能规模化应用浪潮,银行积极开展生成式 AI 大模型技术的钻研和探索,以其作为新质生产力建设的发力点之一。系统运维团队聚焦研发基于 AI 大模型技术的运维知识管理平台——“运维小助手”,结合实际工作经验,将传统知识库与AI 大模型技术有机融合,实现不同角色的运维人员在多场景中对运维知识、信息的快速查询与运用,辅助运维人员高效利用相关运维知识,使其能够快速作出精准的运维决策,进一步提升运维工作效能。
科技系统承载全省万亿级金融资产规模的系统运转,日均处理近亿笔日交易,保障业务的安全性、稳定性与可靠性是一项艰巨而复杂的任务。面对日益增长的海量复杂交易,运维人员缺少快速定位问题、智能辅助分析、自动化归纳总结并形成可复制经验的管理工具,运维管理工作具体面临以下几方面挑战:
1. 数据分析与理解能力:随着技术的不断迭代更新和 IT 架构的日益复杂化,IT 运维人员每日需处理的信息量呈指数级增长。他们需要不断学习和适应新技术、新架构,以应对这一挑战。如何快速而高效地分析海量的文本和数据,准确理解并妥善处理这些信息,成为运维人员面临的一大难题。
2. 系统故障问题定位:针对复杂的 IT 系统,故障预测和诊断工作尤为关键且艰巨。运维人员需深度分析系统日志、性能数据等,以提前洞察潜在故障,迅速定位问题所在,并及时采取解决措施。这一过程中,他们需要凭借丰富的经验和敏锐的洞察力,快速思考,面临的压力巨大。
3. 自动化分析与总结:运维工作涉及大量重复性任务,如监控系统状态、记录异常事件、分析性能指标等。因此,撰写事件报告、日周报等文档也是运维工作的重要组成部分。运维人员渴望拥有一个智能工具,能够协助他们完成文档和报告的撰写工作,减少手动输入和整理数据的时间,从而加快工作进度,提升整体工作效率。
4. 知识与流程标准化:在 IT 运维领域,经验和知识的积累与传承至关重要。将各个运维人员的宝贵经验和知识转化为标准化的流程和最佳实践,不仅有助于减轻运维人员的日常工作负担,还能帮助新入职的员工更快地融入团队,掌握工作技能。通过有效的知识管理,可以确保运维团队的知识体系得以持续更新和完善,为银行业务的稳健发展提供有力支持。
借助大语言模型本身的学习能力,在对运维文档进行学习后,回答运维人员提出的问题,从而辅助运维人员快速找到相关的运维信息。让大语言模型从大量未标记的文档中学习知识,通过理解这些文档,大语言模型可以捕捉到其中的关键信息、模型和规律。一旦模型学习到了足够的知识,它就能够对运维人员提出的问题进行理解和回答。这样,运维小助手作为一个强大的辅助工具,能够帮助运维人员便捷地获取所需的运维信息,而无需手动查阅文档,从而提高运维人员的工作效率。
技术架构:包括文档预处理、文档向量化、问题解析、问答知识段落解析、答案生成、前端界面等功能模块。为了兼顾系统在专业性知识的准确性和模型的训练效率,采用将知识外挂作为大语言模型的记忆体的策略,将知识通过BGE-M3 这一 Embedding 模型向量化后存储在可修改的向量数据库中。选用 LangChain 作为基础开发框架来搭建和管理知识库问答系统,不仅为用户提供了便捷的对话交互方式,也为后续的功能扩展和优化提供了良好的基础。而集成的大语言模型 BAICHUAN-13B,则承担了系统的核心功能,负责理解用户提出的问题和知识库中的内容,并重新组织语言生成相应的答案返回给用户。
知识库的建立:运维文档的切分是构建知识库问答系统中至关重要的一环。我们需要将文档切分成意思完整且独立的知识段落,作为知识库中的最小单位,用于与用户的问题进行匹配。文档的切分直接影响到问答助手对知识的理解和系统的命中率。在切分器的选择上,考虑到运维文档中一个章节内上下文的强关联以及对顺序的要求,我们发现LangChain 中的通用的切分器如 Recursive Character Text Splitter 等,所使用的切分依据并不适合运维小助手知识库。在这种情况下,我们自开发了切分器,根据文档中自身的章节结构进行切分,保留了文档内部的逻辑关系和语义连贯性。在拆分后,我们引入了每个知识段落所在文档的标题作为额外信息,这一策略能在检索过程中能够更加准确地定位到与用户查询相关的知识点,提升命中率,帮助系统更好地捕捉文档的语义信息,使得系统在进行答案检索时能够更加准确地匹配用户的查询。在使用自开发的拆分器并引入标题作为辅助信息后,测试集问题在知识库中的命中率从 60.5% 提升到了77.3%。
文档内容向量化:在切分文档后,章节内容会被通过Embedding 模型向量化,将它们编码为一个统一的向量空间中的向量。我们在对 Embedding 模型选型时首先尝试了 BGE-LARGE-ZH-V1.5,但由于其支持的 token 数量较低,无法支撑部分较长的运维文档的章节,因此我们最后选用了 BGE-M3。其有能力处理较多的 token,token 数最多可达 8192,这足以覆盖主要运维文档的章节长度,从而确保在知识库中,每个知识点都能包括更为详尽和完整的信息。为了提升模型的表现,我们收集了运维专家针对知识库中的运维文档内容提出的问题,以及在文档中对应的答案。这些问答对作为小样本被用于微调 Embedding 模型,以确保模型能够更好地理解和捕捉到关键信息,并能够在向量空间中更准确地匹配相应的知识点,从而成功提高了模型在运维文档知识库中的命中率和检索性能。同时,我们将微调后的模型和基础模型进行了合并。通常对基础 BGE 模型微调可以提高其在特定目标任务上的性能,但这可能会导致模型在目标领域以外的通用能力严重退化。通过合并微调后的模型和基础模型,可以显著增强特定任务的性能,同时保持其在其他任务中的有效性,为未来拓展其他运维场景铺平道路。
大语言模型的微调:我们采用Prompt Engineering 来改善大语言模型的表现。Prompt Engineering 的核心是在提供尽可能多的上下文信息的同时,通过提供少量示例来更好地让大模型了解当前的任务。大语言模型本身具备一定的关键词提取能力和语义理解能力,可以根据向量化知识库中的内容进行重新理解、提取内容,并组织语言进行回答,但对 prompt的用词比较敏感,有时候改变一个词甚至动词都会导致完全 不同的回应。通过多轮 prompt 的迭代 , 我们发现大语言模型可以更准确地根据知识库中提取的相关内容生成相应的回答。考虑到运维工作的严谨性,为了保证运维小助手的可靠性和安全性,我们也特别调整了 prompt 的设计,加入例如“根据已知信息”、“不允许在答案中添加编造成分”等限制,以确保大语言模型严格遵循文档所包含的信息来回答用户的问答,避免模型产生 hallucinate(虚假的信息)。同时,在回答问题时,运维小助手会明确告诉用户答案出自哪个文档的哪个章节,并展示该章节的内容。这样既保证了答案的真实有效性,又方便用户快速了解答案的上下文。如果用户提出的问题无法在现有文档中找到答案,运维小助手会明确回答用户无法找到该问题的答案,不会虚构或杜撰任何内容,防止了因为误导而可能导致的运维事故的发生。
运维小助手已经端到端走通,在业务专家准备问答测试集中,回答的命中率超过了85%,完成了基于国产 GPU 的大语言模型知识库问答系统的概念验证,但后续仍需要进一步迭代,持续更新和完善知识库内容,并不断优化模型的表现。
文档质量是运维小助手系统性能的关键因素。为了确保信息的及时性、准确性和全面性,知识库需要根据行内的运维工作要求持续完善和更新,以提高知识库的质量和覆盖范围,这可能涉及自动化的文档更新和生产数据读取的机制的引入。
模型本身的能力也至关重要,因此建立健康的模型生命周期是必不可少的。在用户使用过程中,不断收集用户反馈,并依据反馈数据定期对模型进行微调和性能评估,以确保模型始终能够保持高效、准确和可靠。
相关文章点击查看合集:人工智能:AI大模型文章汇总
…
关注我的微信
带你体会外面世界de别样人生^
53AI,企业落地大模型首选服务商
产品:场景落地咨询+大模型应用平台+行业解决方案
承诺:免费场景POC验证,效果验证后签署服务协议。零风险落地应用大模型,已交付160+中大型企业
2025-07-19
Agent时代的探索&字节的Trae Agent解析
2025-07-18
人类的考试,考验不了AI了
2025-07-18
入局AI Infra:程序员必须了解的AI系统设计与挑战知识
2025-07-18
AI Agent 深度剖析:现状、价值、局限与未来
2025-07-18
多智能体协作+企业know-How,Agent云重构AI应用落地新范式
2025-07-18
新手必看!百度智能体商品挂载全攻略,流量变现快人一步
2025-07-18
下一代智能协作的雏形:字节跳动AIME框架如何推动AI多智能体系统演化
2025-07-18
ColQwen-Omni:RAG全模态检索来了,支持【文本|图像|视频|音频】四种模态!
2025-05-29
2025-05-23
2025-05-07
2025-04-29
2025-05-07
2025-06-01
2025-05-07
2025-04-29
2025-06-07
2025-05-20