微信扫码
添加专属顾问
我要投稿
金融科技与大模型技术结合的新探索,提升金融服务效率和风险防控能力。 核心内容: 1. 金融科技发展背景与企业知识图谱应用现状 2. 大模型技术在金融领域面临的挑战与问题 3. 基于大模型的知识图谱构建与应用成果展示
1.课题背景
《金融科技发展规划(2022-2025年)》作为指导金融科技健康有序发展的纲领性文件,明确强调了利用新兴技术加强金融服务实体经济的能力,提升金融风险防控水平,并促进金融资源的高效配置。同时,《证券期货业科技发展“十四五”规划》作为行业专项规划,指出要通过完善金融科技标准体系、深化大数据与人工智能应用等措施,增强证券期货机构的核心竞争力和服务效能,为投资者提供更加丰富、便捷、安全的金融服务。这两份重要规划的出台,彰显了我国对金融科技发展的高度重视和前瞻性布局。金融科技被寄予厚望,旨在通过技术创新驱动金融业态和服务模式的深刻变革,为构建现代化金融体系提供强大支撑。
近年来企业知识图谱和大模型技术在金融证券领域均得到了较为广泛的运用。但是由于传统自然语言处理技术的限制,导致新闻、舆情等复杂非结构化数据中蕴含的信息无法被高效准确地提取并融入知识图谱中。同时针对知识图谱的业务查询和结果生成大量依赖人工干预,无法便捷地为业务提供服务。而通用大语言模型在证券期货行业场景中的应用也暴露出诸多问题与挑战,包括缺少行业知识,容易基于幻觉生成错误的不准确的信息,以及掌握的知识无法高效地快速更新。
为了解决上述两项技术面临的问题,本课题通过检索增强生成和智能体等新技术实现大语言模型和知识图谱的创新性结合,并以企业关联关系、事件影响和舆情脉络查询为方向,探索和论证相关方案的可行性,并针对相关业务实践开发相关应用,旨在展现其在合规尽调、风险管控和投研决策等证券金融场景中的应用潜力。
2.课题内容与成果
本课题成功摸索出一套能有机结合大模型和知识图谱的技术方案,包括知识图谱构建阶段、知识图谱交互、知识图谱应用三个方面,并在不同场景中验证了其有效性。基于上述针对复杂文本的图谱构建和通用知识图谱查询框架,在企业关联关系、事件影响和舆情脉络三个查询场景中,实现了传统NLP技术与人机交互框架较难或无法实现的数据解析、自然语言交互和分析结果生成等功能。
2.1企业知识图谱构建
本课题编写与调优了包含多种任务形式的提示词指令。例如“事件分类”属于文本分类任务,“事件摘要”是对文本的总结,“事件地域”属于信息提取任务。“事件影响”中的每一个子项要求大模型在完成上述三个任务的同时通过理解前后文将相关的信息关联在一起,这对于以往的深度模型来是极其困难的。在研究的过程中发现,大模型不仅能按提示词指令解析出原文中的信息,还能根据其他字段与提取信息间的逻辑关系,用自身掌握的知识对部分字段进行补全。
本课题提出了大模型结果的图存储方法,该方法可以将大模型的解析结果按字段分别存储到图数据库中。在向量数据库中,作为对事件高度总结的标题会转化为长度为1024的向量,与事件主体、事件摘要以及为每个事件生成的唯一ID等信息一并存入向量数据库中。向量数据库作为知识图谱的一部分,被用来存储事件的索引信息。在图数据库中,“事件”会作为一种特殊的节点类型存在。之前存入向量数据库中的事件唯一ID会被用作具体事件实例节点的ID,以此实现向量库和图库中数据的对应。事件发生时间、事件名称、事件分类、事件主体和事件地域等相关信息则会作为节点属性一起存入图数据库中。事件本身和一起提取的受影响实体在被存入图库前,都会在图库中检索是否存在相似事件和实体,从而避免重复问题。
图1:舆情事件解析结果的处理与存储
2.2基于大模型的企业知识图谱查询框架
本课题提出了使用智能体(Agent)和检索增强生成(Retrieval Augmented Generation,以下缩写为“RAG”)技术,在知识图谱查询,数据召回和结果生成阶段融入大模型能力,并以此为基础定义出一个基于知识图谱查询Agent的通用知识图谱查询架构。
为了避免大量数据输入造成大模型“过载”,把数据按使用场景或业务域分类封装成标准API,Agent只需在粗颗粒度的API层面做出选择与判断即可。另外采取Multi-Agent方案,即先使用一个Agent与用户交互,将需要调用的API限定到一个范围内,然后在执行器调用API的过程中使用相应API中的内置Agent完成最终匹配。
检索和生成则依赖RAG架构解决大模型幻觉问题。使用文本相似度算法和召回排序算法,从庞大的数据集合中找到与搜索对象最相似的文本。把检索到的信息与原始查询(或是经过前置模型改写过的查询)一起输入到生成模型中(通常为LLM),借助模型的理解和生成能力产生最终结果。
图2:知识图谱查询服务架构
2.3场景应用与实践成果
本课题在三家共研机构在共建的大数据实验室环境下,以企业关联关系查询、事件影响查询和舆情脉络查询三个场景为例,进行了实践。
在企业关联查询场景,用户只需在对话框中简单地输入想要查询的企业和关联关系类型,知识图谱查询Agent的交互模块便会进行初步的意图匹配,并通过知识图谱检索模块去调用工商名称匹配Agent获取查询中企业简称所对应的工商全称,生成下一步指令指挥检索模块调用企业关联查询Agent。企业关联查询Agent会把用户意图与查询股东、对外投资、受益股东和企业间关联关系等可能的业务查询进行更细分的匹配,然后生成包含调用接口和调用参数的指令给到检索模块,并把收到的查询结果返回给查询Agent,生成自然语言的回答结果。
在事件影响查询场景,知识图谱查询Agent会将提问与其他通过交互获取的信息下发至的事件影响查询Agent。后者的交互模块会根据指令把原始查询转化为事件描述,然后通过检索模块去先前构造的知识图谱中召回相关事件信息以及土地和产业链等由图谱穿透得到的关联信息。获取数据后生成模块会依据用户提问对召回的数据通过语义理解再次进行过滤,最后在原有一个或多个影响描述片段的基础上整理出完整的事件影响评估。当用户查询的事件没有直接可参考的影响分析时,可以查找“知识”中是否有类似的情况以供推演可能产生的影响,并进一步完成后续的影响传播。
在舆情脉络查询场景,查询服务Agent在收到用户关于查询某家企业的事件脉络的请求后,会把匹配后的企业信息与用户查询一起发送给舆情脉络查询Agent。后者会综合舆情脉络所涉及的企业、事件和时间范围等信息从知识图谱中召回相关新闻,并交由生成模块按提示词指定的格式生成脉络。
3.总结与展望
本课题创新性地将大模型和知识图谱相结合,通过充分利用知识图谱高效的记忆能力和大模型强大的推理生成能力,提出了基于大模型的企业知识图谱的构建方法和查询框架。并以拓客、投研和风控等证券金融场景为例,开发了企业关联关系、事件影响和舆情脉络三个查询功能,验证了本课题提出的大模型和企业知识图谱的结合方案在基于非结构化文本的图谱构建、用户交互、影响传播挖掘和复杂逻辑总结等方面相对现有方案的优势。随着未来基座大模型和相关技术的发展,相信两种技术的相辅相成,能为金融科技发展带来更大的帮助。
53AI,企业落地大模型首选服务商
产品:场景落地咨询+大模型应用平台+行业解决方案
承诺:免费场景POC验证,效果验证后签署服务协议。零风险落地应用大模型,已交付160+中大型企业
2025-06-05
如何构建AI Agent快速分析行业景气度
2025-06-05
MCP Server 之旅第 5 站:服务鉴权体系解密
2025-06-05
Cursor 1.0 正式发布!BugBot 自动代码审查,Background Agent 全面开放、MCP一键安装
2025-06-05
11张图全面总结 MCP、A2A、Function Calling 架构设计间关系
2025-06-05
一手实测地产首个Agent,实话说:不错!
2025-06-05
面向 Data+AI 的新一代数智开发平台
2025-06-05
AI测试平台开发的几点思考
2025-06-05
深入 A2A Protocol:一个 Python 的例子
2024-08-13
2024-06-13
2024-08-21
2024-07-31
2024-09-23
2024-05-28
2024-08-04
2024-04-26
2024-07-09
2024-07-20
2025-06-05
2025-06-04
2025-06-04
2025-06-03
2025-06-02
2025-05-31
2025-05-29
2025-05-29