免费POC, 零成本试错
AI知识库

53AI知识库

学习大模型的前沿技术与行业应用场景


以大模型和图谱驱动的企业综合分析系统构建思路

发布日期:2025-10-24 17:19:51 浏览次数: 1537
作者:Edge艾知

微信搜一搜,关注“Edge艾知”

推荐语

如何用大模型+知识图谱打造更智能的企业分析系统?本文详解金融分析场景下的技术架构与实现路径。

核心内容:
1. 传统大模型在金融分析中的三大痛点与改进方向
2. 四层架构设计:从数据解析到智能体协同的完整解决方案
3. 关键模块实现:数据解析层与知识检索层的技术选型与实践

杨芳贤
53AI创始人/腾讯云(TVP)最具价值专家

关注艾知 体验AI一句生图

随着AI技术的不断发展,其表现出的“推理思考”能力在金融分析场景有广泛的应用空间。通用的大模型应用在具体的金融分析场景存在一些缺陷:


1)传统模型约束大模型推理,赋能程度较弱

2)未充分结合外部公开数据,行研报告、供应链信息等

3)报告内各章节之间内容相对独立,大模型分析没有充分考虑不同数据间的联动关系和因果关系


由此分析,总体系统的功能需求改进方向就比较明确了:


1. 总体分析应以大模型为主导,小模型为辅,充分挖掘其逻辑分析能力,避免“执果索因”


2. 充分利用搜索获取外部数据,结合内部数据,构建知识架构,清晰引用链路


3. 能够在保证宏观结论一致性的框架下,提升具体分析的微观深度,产出全面且深入的洞察


以下是我结合需求和当前技术的系统构建思路总结,与大家分享。


P.S.:关于大模型的推理能力的,许多AI大佬提出了批判的观点,但大体在应用层面的探索和落地还是能走通的)



总体思路

整体系统可由四个关键层次组成,构成端到端的企业洞察与报告生成链路。充分发挥大模型在信息整合和逻辑推理方面的优势,同时辅以传统模型的精准计算和可解释评分,并利用多智能体协同框架生成报告。


首先是数据解析层,包括行内数据库的对接,以及非结构化的年报、审计报告、行业研究、新闻与舆情等多模态数据。


接下来是知识检索层,数据按照类型进入传统检索,Vanilla RAG,GraphRAG与知识图谱模块,形成传统检索,语义检索,图结构关系检索配合的综合检索模式。


第三层是传统模型和工具集群,为下一步智能体分析整理提供快速、精准、可解释的基础判断依据。


第四则是基于大模型的多智能体层,大模型在之前三层的数据上下文基础下,先规划总体推理框架和业务洞察,再进行细粒度的分析,经过大模型自查与人类反馈机制确保每次输出可靠性,最终整合润色出分析报告



关键模块具体思路

在整个体系中,关键模块的设计直接决定了报告生成的质量与可信度。每一个模块不仅要实现单点功能,还要在上下游逻辑中形成紧密衔接,确保从原始数据到综合洞察的链路畅通且可审计。


1. 数据解析层

作为整个系统基础的数据解析层,由接口程序分别对接网络检索服务、非结构化数据处理模块和内部数仓接口,对接各自的预处理模块,对数据进行初步的清洗和切分。


具体的数据形态和分析逻辑需要形成业务理解和工具程序积累,为智能系统的工具调用打下基础,但开发方法和目标需要具体情况具体分析,这里不做展开讨论。


2. 知识检索层

其次是知识检索层。由于数据来源繁杂且更新频繁,单一的检索方式难以兼顾覆盖率与准确率。传统的倒排索引,结合向量检索驱动的Vanilla RAG,以及融合知识图谱概念的GraphRAG,侧重于不同类别信息的检索。


传统索引引擎如Elasticsearch,可用于处理精确匹配场景,如公司名称、法人、统一社会信用代码等;基于向量检索的Vanilla RAG方案(如基于FAISS、Milvus的检索方案)聚焦于语义检索,能够从大规模非结构化文本中捕捉与企业或用户查询相关的上下文频段;


融合了知识图谱概念的GraphRAG,由大语言模型做关键信息的逻辑关系的提取,或将特定业务逻辑融入关系提取的提示词中,形成类似知识图谱的文档切片关联图谱,且关联关系可以跨多文档,还可以进一步对相似的文档集合进行总结,可以形成先匹配文档集再匹配具体切片的逻辑,兼顾检索的全局能力和细力度精确匹配。



传统的知识图谱相比GraphRAG,在schema上更加明确,能进一步形成自顶向下的知识组织结构(当然也有在prompt中加上schema提取的GraphRAG改进思路),通过实体识别与关系抽取模型,进一步对之前以语义和相似度为主的信息片段,进一步整理成以逻辑结构为主的图谱结构,形成对企业、高管、投资人、产品、诉讼事件等信息建模,再存入图数据库等,开发以图特征驱动的分析,场景如供应链集中度分析、客户依赖度计算等。


如需进一步理解不同事件或指标间的因果关系,可引入因果推断工具(如 EconML)。通过构建因果图和运行反事实实验,提供更高解释性的推理推理路径。


但GraphRAG相比Vanilla RAG会有更高的构建成本,图谱的结构和建设也需要符合需求的设计并不断迭代。因此在实际开发中可以作为架构上的增强模块选择是否开发。


检索结果的融合:


以上三种技术的结果融合可以通过专门训练的重排序模型,结合具体业务需求,对精准信息、语义相似度和逻辑关系的总得分赋予不同的侧重度,也方便使用者动态调整。

从需求触发,检索层的总体目标是在能保证对关键信息的快速召回,也能在开放性问题上提供高质量的语义结果。为提升整体检索层召回的相关性和准确性。


3.ML模型和工具调用模块

平行于检索层运行的传统ML模型和工具集群,充分利用已有的数据和模型资产,与大模型驱动的系统形成协同。


传统机器学习模型在量化风险与保证可解释性方面更为稳健。对比大模型更清晰的评分标准和特征重要性,不仅帮助客户经理理解模型结论,也符合银行监管对可解释性的要求。


传统模型的结果既可以直接在报告中呈现,也可作为约束条件输入大模型,以确保最终建议既合理又可追溯。


4. 智能分析和报告生成层

接下来是基于大模型的智能分析和报告生成模块。在获取知识检索增强层的输出和传统模型的结果后,可依据上下文工程和提示词技巧,对多源证据进行整合、再由大模型推理分析。


在数据整合、推理分析和报告生成这一阶段,可以使用“总分总”的多智能体架构,形成“规划-执行-汇总/反馈”的大模型运行闭环。


具体展开来看,在获取相对明确的报告分析方向和相对充足的上下文信息后,先由智能体做总体报告分析逻辑链条的推理生成,在提示词中可以给出一些逻辑分析示例,如:拆解宏观-中观-微观间风险传导链的拆解,原料-加工-销售个环节的外部依赖等。


再以此链条为大纲对章节或分析任务进行进一步拆解,分配给各个推理智能体进行细粒度的推理和分析报告的生成。最后由负责汇总的智能体检查各个推理智能体的产出与逻辑大纲的一致性,如果由较大出入,可触发对应推理智能体在获取其反馈信息后重新生成。


若多次反思推理未能获得一致性结果,则可以引入人类决策选择。最终在由一个负责报告编辑的智能体做整体内容的润色和输出。


综上所述,四个模块在体系中各司其职,结合了大模型的智能分析和推理生成能力,也利用了传统工具和模型评分确保结论的量化与可解释。通过这种分层协作的设计,整个系统能够在技术上平衡精度、广度与可信度,实现从数据到业务洞察的闭环



新企业分析策略

对于几乎没有内部结构化数据的新企业,系统的切入点是外部信息的快速整合。主要通过网络检索和已知报告,获取其工商注册、媒体报道、行业研报、供应链和舆情信息,可以迅速勾勒企业的基本画像,包括经营范围、主要客户与供应商、历史诉讼情况以及市场口碑。


由于没有具体或较多的数据支撑传统建模,使用类比分析策略对新客企业进行分析。


在这一逻辑基础上,系统须在设计上明确添加收集行业特征的子工作流和外部对比基准企业的子工作流,以行业常见情况和标杆企业,支持对新企业的潜在风险与金融服务需求做出初步判断。


由于数据源的不确定性更高,输出内容可以结合一些大模型的生成置信度数值,作为其生成内容可靠性的参考指标,也可以在提示词中明确指出让大模型输出需要人工补充与核实的部分,从而为新客的营销与风险评估提供有效的冷启动能力。



如果您觉得这篇文章对您有帮助

感谢您为我【点赞】、【在看】

我们也会持续更新更多AI新功能

关注置顶不迷路哦~


53AI,企业落地大模型首选服务商

产品:场景落地咨询+大模型应用平台+行业解决方案

承诺:免费POC验证,效果达标后再合作。零风险落地应用大模型,已交付160+中大型企业

联系我们

售前咨询
186 6662 7370
预约演示
185 8882 0121

微信扫码

添加专属顾问

回到顶部

加载中...

扫码咨询