免费POC, 零成本试错
AI知识库

53AI知识库

学习大模型的前沿技术与行业应用场景


企业级AI独角兽Glean揭秘知识图谱增强大模型:企业AI的关键基石,重新定义智能系统的上下文理解

发布日期:2025-11-05 07:55:19 浏览次数: 1566
作者:知识图谱科技

微信搜一搜,关注“知识图谱科技”

推荐语

企业AI的未来在于知识图谱与大模型的完美结合,Glean揭秘如何通过结构化信息提升AI的上下文理解能力。

核心内容:
1. 知识图谱如何解决大语言模型在企业应用中的局限性
2. 知识图谱的核心结构与工作原理详解
3. 企业级AI代理构建中知识图谱的实际应用场景

杨芳贤
53AI创始人/腾讯云(TVP)最具价值专家

How knowledge graphs work and why they are the key to context for enterprise AI

文章摘要

知识图谱通过结构化信息表示,为企业AI提供关键的上下文理解能力。虽然大语言模型在语义理解方面表现出色,但在多跳推理、精确事实召回和企业特定知识处理方面存在局限。知识图谱有效填补了这些空白,成为构建可靠企业AI代理的基础。

引言:从人类认知到机器智能的跨越

在当今数字化转型的浪潮中,企业级人工智能的应用正面临着一个核心挑战:如何让AI系统真正理解企业复杂的组织结构、业务流程和数据关系?答案就在知识图谱这一革命性技术中 

构建能够在企业环境中可靠执行任务的AI代理,需要的不仅仅是强大的计算能力,更需要一套能够反映人类信息处理方式的系统。正如人类在处理复杂信息时会自然地将所读内容与周围的人员、流程、工具、项目和策略建立联系,AI系统也需要这样的关联能力来解决复杂性和冲突信息,从而做出明智的决策 

什么是知识图谱?

知识图谱是一种结构化的信息表示方法,它以机器可读的格式捕获实体及其之间的关系 。在企业环境中,知识图谱作为基础抽象层,将分散的数据——包括人员、文档、工具、项目和系统——连接成一个连贯的网络。

与传统的搜索索引不同,知识图谱不仅关注内容本身,更重要的是关注关系。例如,它能够建立客户与支持票据之间的关联,使其特别适合为企业AI系统提供上下文知识基础 

知识图谱的核心结构

知识图谱的核心是三元组结构:(主语,谓语,宾语)。这种结构编码特定的事实或关系,例如(工程师A,拥有,Jira票据B)或(文档X,引用,项目Y)。这些语义三元组构成图的边,可以通过遍历来推断额外知识或解决复杂查询 

在企业场景中,这种结构能够揭示跨组织孤岛的微妙洞察——比如识别产品发布如何与路线图文档、贡献者、支持案例和客户反馈相关联。知识图谱的表达力还包括关系之外的附加事实。边属性——如时间戳、访问控制、置信度分数或来源——可以附加到每个关系上,使系统能够利用对企业治理至关重要的元数据进行推理 

知识图谱的工作原理

在企业环境中创建知识图谱始于从自然语言输入中提取和识别有意义的实体。以"Reddit"这个词为例,虽然看似简单,但"Reddit"在不同上下文中可能指代完全不同的实体。如果是销售组织的客户经理提到,它很可能指的是一个客户;在营销对话中,它可能指向在社交媒体网站"Reddit"上的广告支出 

消除这些歧义需要考虑用户角色、意图和周围内容的上下文感知注释,以正确识别和映射知识图谱中的实体。

三个关键阶段

知识图谱的构建涉及三个关键阶段:

  1. 实体注释
    :识别和标记文本中的实体
  2. 意图理解
    :将自然语言查询转换为结构化表示
  3. 查询执行
    :通过遍历知识图谱检索精确信息 

传统上,意图理解是通过半自动学习实现的。人工操作员会播种已知的查询模式——如"查找Jira标签"——并使用它们来识别常见意图。然后通过分析查询日志来发现映射到相同意图的其他措辞,从而扩展这些种子查询 

随着大语言模型(LLM)的引入,前两个阶段——实体注释和意图识别——变得更加强大和自动化。LLM擅长解析自然语言,减少了手动模式创建和基于规则的消歧需求。在Glean,我们借助LLM将图扩展到支持数千个边 

大语言模型在企业AI应用中的局限性

尽管LLM在捕获上下文窗口内的广泛语义关联方面表现出色,但它们在多跳推理、企业特定语言和理解过程或使用模式方面存在困难。因此,基于LLM的数据提取往往具有固有的损耗性 

四大核心问题

1. 过度权衡术语的接近性
在企业环境中,LLM经常在精确性方面出现问题,过度权衡术语的接近性。例如,一个虚构用户Jennifer Armstrong,现场营销经理,在最近的查询中被错误识别为客户供应商和员工体验负责人。追溯问题源头,LLM误解了她组织的一个活动的Slack消息,给她分配了错误的头衔 

2. 混淆相似名称的实体
类似的问题出现在产品命名上。Claude 3.7 Sonnet和Claude 3.5 Sonnet v2是不同的模型,但LLM经常将两者混淆,将它们的功能或文档合并成一个错误的答案。没有结构化消歧,即使是模型版本之间的细微差别也容易被误表示 

3. 确定性查询的困难
知识图谱通过将查询基于已知的结构化实体来帮助缓解这些问题。当被问及"列出亚洲的所有客户经理"时,知识图谱可以将查询术语"客户经理"识别为特定的工作角色,而不是一般描述,将"亚洲"识别为位置。有了这些信息,系统就可以对所有在亚洲有客户经理角色和位置的员工执行详尽的、确定性的结构化查询。这是仅凭LLM难以始终如一地做到的 

4. 跨实体关系推理困难
在更复杂的任务中——比如回答"我在哪里为Reddit提交功能请求?"——LLM必须在Reddit社交平台和Reddit企业客户之间进行消歧,识别流程涉及Jira,并将这些理解链接成连贯的工作流程。这种关系推理和多跳推断水平在没有映射这些实体、角色和系统的机器可读知识图谱的情况下很难可靠地实现 

知识图谱如何变革工作方式

让我们通过一个具体案例来理解知识图谱的实际价值。任何高管需要弄清楚的最具挑战性但频繁的问题之一是——"项目X相对于其OKR的进展如何?"这是一个高价值、高意图的问题,在大多数系统中很难回答,特别是在工程环境中 

要准确响应,系统需要关联多个数据源——特别是代码贡献——并将它们映射到为给定项目定义的目标和关键结果。这种关联允许评估项目是否处于红色、黄色或绿色状态。

挑战在于确定哪些代码更改与哪些OKR相关。LLM在这里遇到困难,因为这不是涉及解释叙述性语言的任务。代码是简洁的、结构化的,通常缺乏将其直接注释到项目或业务目标的直接注释 

虽然一旦识别出正确的信号,LLM擅长总结进度或生成文本,但它们不太适合首先浮现这些信号。为此,你需要一个可以将代码工件——如目录、文件或组件——映射到特定项目的系统。这涉及离线流程、项目元数据和启发式方法(如目录结构,例如docubuilder/文件夹)——所有这些都是馈送到知识图谱中的关键组件 

更多企业应用场景

为了帮助您进一步重新想象知识图谱在企业AI中的影响,这里有几个更多的示例:

销售场景:哪些高价值交易由于产品功能缺口或与这些账户重复的P1支持升级而面临滑坡风险?这个问题使用多跳推理来分析客户数据、产品功能和支持票据 

IT场景:哪个系统故障会在我们的服务中触发多个冗余警报,我们如何减少噪音?这个问题理解基础设施工具和待命分页调度,将日志与不同服务关联,并识别冗余以减少噪音 

HR场景:为我提供个性化的最新员工入职活动列表。知识图谱可以通过捕获团队活动以及关键上下文——如工具、程序和文档——并使用该信息帮助LLM生成优先级、始终最新的入职任务列表来加速入职 

个人场景:帮我写绩效评估的自我评估。知识图谱可以浮现员工活动的综合列表——以及团队、目标和合作者等重要上下文。与LLM配对,它们可以显著加速起草和完善高质量自我评估的过程 

构建企业知识图谱的挑战

在企业中构建高质量的知识图谱在根本上是不同的——在某些方面比构建像Google或Bing那样的知识图谱更具挑战性。主要挑战是隐私敏感性、对可扩展算法的需求,以及在只有相对较少的文档集可用且手动审查不是选项时识别关键实体和事实的困难 

三大核心挑战

1. 隐私和安全约束
与公共网络数据不同,企业信息通常包含敏感、机密或受监管的内容,这些内容不能自由访问、手动审查或暴露给人工注释团队(这在公共图项目中很常见)。实体提取的每一步都必须尊重组织隐私、合同和法律边界。图必须被构建为支持员工获得对数据的不同级别访问,这是消费者图不需要设计的 

2. 规模化算法需求
在企业中,"亲自动手处理数据"通过手动审查由于隐私和规模而被禁止或不切实际。手动图构建不能扩展到数千个不同的企业客户,每个都有自己的数据、词汇和安全敏感性。算法化、自动化的方法对于在没有人工干预的情况下处理所有客户的语料库,并随着新数据到达而动态适应至关重要 

3. 有限数据集的实体识别
企业环境中的数据量相对有限,这使得传统的实体识别和关系抽取方法面临挑战。与公共知识图谱可以利用海量网络数据不同,企业知识图谱必须从相对稀少的内部文档中提取高质量的结构化信息 

个人图谱:知识图谱的新维度

在Glean,我们通过一个新层——个人图谱——扩展了我们的知识图谱,它更好地理解工作中的人类上下文。它通过理解你处理不同类型工作的方法并适当地定制AI,将个性化提升到聊天历史之外。这些图谱与Glean的混合搜索架构一起,形成了上下文系统:反映每个组织工作方式的系统,使AI能够为其中的每个人更好地工作 

个人图谱捕获个人工作模式,使AI能够提供个性化和主动的协助。这种个性化不仅基于历史交互,还基于对个人工作风格、偏好和协作模式的深度理解 

构建企业AI的上下文系统

知识图谱与个人图谱结合,再加上混合搜索架构,形成了一个完整的上下文系统。这个系统不仅能够理解组织的结构和流程,还能够适应个人的工作方式,从而为每个用户提供最相关和有用的AI协助 

这种上下文系统的价值在于它能够:

  1. 跨孤岛连接信息
    :打破部门间的数据壁垒,提供全局视角
  2. 减少AI幻觉
    :通过结构化数据验证,提高回答的准确性
  3. 支持复杂推理
    :处理多跳查询和跨实体关系分析
  4. 保护隐私安全
    :确保用户只能访问授权数据
  5. 个性化体验
    :根据个人工作模式定制AI响应

未来展望

随着企业数字化转型的深入,知识图谱将成为连接人工智能与企业现实的重要桥梁。它不仅能够提高AI系统的准确性和可靠性,更能够使AI真正理解和适应企业的独特环境和需求。

对于企事业单位和科研院所而言,投资构建高质量的知识图谱基础设施将是获得AI竞争优势的关键。同时,这也为投资者指明了一个重要的技术发展方向:那些能够有效结合知识图谱和大语言模型的企业级AI解决方案将在未来市场中占据重要地位。

知识图谱不仅是技术创新,更是企业智能化转型的基石。它将重新定义我们对企业AI能力的认知,推动人工智能在企业环境中的深度应用和价值实现。


标签:#知识图谱 #KnowledgeGraph #LLM #大语言模型 #企业AI #GraphRAG #Glean

53AI,企业落地大模型首选服务商

产品:场景落地咨询+大模型应用平台+行业解决方案

承诺:免费POC验证,效果达标后再合作。零风险落地应用大模型,已交付160+中大型企业

联系我们

售前咨询
186 6662 7370
预约演示
185 8882 0121

微信扫码

添加专属顾问

回到顶部

加载中...

扫码咨询