微信扫码
添加专属顾问
我要投稿
回顾知识问答技术发展历程,对比传统方法与现代大语言模型的差异与演进。 核心内容: 1. 知识问答系统的四大核心要素与分类标准 2. 传统符号表示与深度学习分布式表示的技术对比 3. 语义解析到查询执行的完整处理流程解析
也有将知识库编码到计算机模型中,例如逻辑规则、机器学习模型和深度学习模型。
智能体利用知识库实现推理。根据知识库表示形式的不同,目前的知识问答可以分为传统问答方法(符号表示)以及基于深度学习的问答方法(分布式表示)两种类型。传统问答方法使用的主要技术包括关键词检索、文本蕴涵推理以及逻辑表达式等,深度学习方法使用的技术主要是LSTM、注意力模型与记忆网络(MemoryNetwork)等。
传统的知识库问答将问答过程切分为语义解析与查询两个步骤。首先将问句通过语义解析转化为SPARQL查询语句。基于分布式表示的知识库问答利用深度神经网络模型,将问题与知识库中的信息转化为向量表示,通过相似度匹配的方式完成问题与答案的匹配。
其核心思想是根据用户数的问题结合自然语言处理以及信息检索技术,再给定文档集合,或者在互联网网页中筛选出相关的文档,从结构文档中抽取关键文本作为候选答案。最后对候选答案进行排序返回最优答案。
所采用技术包括:1)问题处理,从不同角度理解问题的定义,明确知识检索的过滤条件和答案类型判定。2)段落检索与排序。基于提出的关键词进行信息检索,对检出的文档进行排序,把排序之后的文档分割成合适的段落,并对新的段落进行再排序,查找最佳答案;3)答案处理。根据最后排序后的段落,结合问题处理阶段定义的答案类型抽取答案。形成答案候选集,再对答案候选集进行排序,返回最优解。
3、KBQA,基于知识库的问答系统
(2)词汇关联。主要针对在问题分析阶段尚未形成实体链接的部分形成与知识库的链接,包括关系属性、描述属性、实体分类的链接。
(3)歧义消解。一方面是对候选的词汇、查询表达式排序选优,一方面通过语义的容斥关系去掉不可能的组合。在很多系统中,歧义消解与构建查询紧密结合:先生成大量可能的查询,然后通过统计方法和机器学习选优。
(4)构建查询。基于问题解析结果,可以通过自定义转化规则或者特定(语义模型语法规则)将问题转化为查询语言表达式,形成对知识库的查询。QALD的大多系统使SPARQL表达查询。
4、Hybrid QA Framework 混合问答系统框架
从结构化数据出发的KBQA 重精准的问题理解和答案查询,但是结构化的知识库总是有限:从非结构化文本出发的 IRQA 侧重于利用大量来自文本的答案,但是文本抽取存在精度问题且不容易支持复杂查询与推理。
IRQA 主导的混合框架的技术扩展了如下技术内容:1)候选答案评分,针对每个候选答案选取一些重要特征,并对各个特征打分并形成答案的特征向量。2)答案融合及排序,对新的答案候选集进行再排序,最终由训练好的逻辑回归分类器每个候选答案计算置信度,并返回置信度最高的答案作为最终答案。创新点是同时从IRQA和KBQA获取大量候选答案,并以大量答案佐证作为特征形成答案特征评分向量,这一点正是单独IRQA系统和KBQA系统没有做到的。
KBQA主导的混合框架的技术扩展了如下技术内容:要求KBQA 可以同时利用知识图谱数据和文本数据,自然语言先转化为SPARQL查询,有一部分知识还需要从文档中抽取关系得到解答。这样可以避免前期过度的文本抽取工作,也能适应现实中更常见的图谱和文本混合的知识库。
本书作者在前沿技术开头如是说:
目前还存在两个很大的困难阻碍着KBOA系统被广泛应用。一个困难是现有的自然语言理解技术在处理自然语言的歧义性和复杂性方面还显得比较薄弱。例如,有时候一句话系统可以理解,但是换一个说法就不能理解了。另一个困难是此类系统需要大量的领域知识来理解自然语言问题,而这些一般都需要人工输入。一些系统需要开发一个专用于一个领域的基于句法或者语义的语法分析器。许多系统都引入了一个用户词典或者映射规则,用来将用户的词汇或说法映射到系统本体的词汇表或逻辑表达式中。通常还需要定义一个世界模型(WorldModel),来指定词典或本体中词汇的上下位关系和关系参数类型的限制。这些工作都是非常消耗人力的。
到今年,随着大语言模型如雨后春笋般出现,本书所说的前沿技术突然就不前沿了,因此我就摘抄了。
53AI,企业落地大模型首选服务商
产品:场景落地咨询+大模型应用平台+行业解决方案
承诺:免费场景POC验证,效果验证后签署服务协议。零风险落地应用大模型,已交付160+中大型企业
2025-06-17
当智能体遇上GraphRAG:构建下一代动态路由知识图谱问答系统
2025-06-17
大模型生成知识图谱——GraphRAG原理
2025-06-16
知识图谱焕发生机,激发大模型LLM深层次推理 —— 昨天,今天和明天
2025-06-15
基于知识图谱的Zero-Shot问答:大语言模型的事实锚定新范式
2025-06-14
如何为客户数据构建语义视图?
2025-06-13
构建下一代AI:深入探讨知识图谱 KG 与大模型 LLM 的集成方法
2025-06-02
知识图谱与LLM接口优化:突破复杂推理的性能瓶颈
2025-06-02
大模型时代知识图谱驱动的企业知识大脑
2025-03-26
2025-04-07
2025-04-21
2025-05-06
2025-05-23
2025-03-29
2025-04-07
2025-04-09
2025-04-07
2025-04-03
2025-06-14
2025-05-23
2025-05-23
2025-05-22
2025-05-20
2025-04-20
2025-04-15
2025-04-09