推荐语
还在为数据孤岛和知识沉淀发愁?OntoFlow带你打通从数据到决策的完整链路,让企业知识建模工程化、可持续!
核心内容:
1. 企业数据治理的核心痛点与OntoFlow的解决方案
2. OntoFlow工作流式本体建模平台的四大核心流程与AI辅助设计
3. 从数据接入到业务决策接口的完整功能演示与价值实现
杨芳贤
53AI创始人/腾讯云(TVP)最具价值专家
在很多企业数字化项目里,真正困难的不是“有没有数据”,而是“数据能否被理解、能否被复用、能否支撑决策”。
表、字段、文档、记录、规则,这些内容往往分散在不同系统中,彼此格式不同、口径不同、语义也不统一。结果就是:系统很多,数据不少,但知识无法沉淀,决策难以闭环。
OntoFlow 想解决的,正是这条链路上的核心问题。
它不是单纯的图数据库AbutionGraph的前端,也不是单纯的本体编辑器,而是一个以工作流为核心的本体建模平台。我们把“数据接入、结构理解、数据处理、子图建模、本体入库、查询验证”组织成一条可以被持续迭代的流程,让企业知识建模从一次性的建库动作,变成可设计、可执行、可维护的工程化过程。

特别说明:
- 1)为什么是工作流的形式?
本体建模过程化,好梳理、好理解,数据从哪来、最终变成本体库中的什么形式,流程清晰。 - 2)非传统工作流!非拖拉拽建模!
OntoFlow的工作流构建本体库只有4个流程,固定的,不需要拖拉拽,在每个环节都可以使用AI辅助建模/代码生成。 - 3)可以把本体构建的工作流 AI 化吗?让 AI 代替设计师角色!
可以。但前期不推荐!
OntoFlow的初始版本是全AI化的,从理解数据到完成本体构建,以及应用侧的检索与推理,但AI在业务理解与本体规则转换效果上还有差距,所以回退为采用本体流的方式构建一套标准体系,若以后企业积累的本体转化经验越来越多,OntoFlow上的 Team Agent 就可以发挥作用了,但不是项目初期。
正如 Palantir 的 Evo-DKD 论文及其它公开论文所述:本体不会是一次性建完的静态模型,而是需要在人机协同中持续演化,关系型数据转知识图谱的关键挑战仍然是语义映射与人工成本,而 LLM 正在加速这一过程,尤其适合“结构探查、语义补全、映射建议、子图构建”。
这篇文章将结合 OntoFlow 当前的产品实现,演示一条从数据到本体、再到业务决策接口的完整链路。
一、为什么企业需要“本体建模平台”
很多团队已经在做数据治理、知识图谱、主数据、标签体系,但常见问题仍然存在:
数据源很多,但结构不统一,字段含义依赖人工记忆。
使用OntoFlow ,你可以把不同来源的异构数据统一接入,并采用统一的格式进行后续处理。
知识图谱能展示关系,但缺少稳定的概念层和规则层。
在 OntoFlow 中,你可以沿用传统知识图谱的关系建模,并在知识图谱中引入概念(如使用本体论构建一个完整的动态的GraphRAG)和规则(如RAG中的一切对象都可以由你进行自定义设计与优化,包括索引的分布式规则、社区对象的更新与生成规则、一跳邻居的实时高基数统计规则用于度指标的计算并返哺监控社区的分裂等等),你也可以运用此思想去实现一款自动触发Agent更新用户意图的 AI Memory 系统,函数规则可以在OntoFlow上通过创建函数新增,并自动调用LLM帮你写出代码。

图谱构建过程割裂,数据处理、模型设计、查询验证往往散落在不同工具里。
使用OntoFlow ,你可以把原本Palantir中的多个独立平台,或者企业自建的多个数据中台、大数据处理平台、知识中台、AI平台在一套系统中轻量化的实现。即你可以只需要通过4种类型的工作流程节点就可以实现那些技术累加的平台。

图谱建出来之后,难以真正进入业务系统、AI应用或决策流程!
使用OntoFlow ,你可以轻松的把业务知识融合进本体模型中,特别是业务需求的不断增加与优化,你都可以通过 AI Coding 的方式辅助你完成业务开发,并立即形成可供AI和外部系统调用的 API、MCP、Skill,以及采用不同的方式(Agent自动发现、流式事件、定时任务等)触发它。
知识图谱与“本体论”或者本体图谱的区别?
在 OntoFlow 中,基础技术框架是知识图谱,描述业务的骨架是知识图谱,数据存储与数据计算也都在知识图谱中进行,所以,本体图谱实际上是知识图谱的能力延伸,它把知识图谱(静态,只有属性和类型定义)扩展成动态的知识图谱(可以定制计算图数据的函数,可以定制监控图数据的函数),从少量的数据库增删改查升级为全量的事实计算和监控,而不需要关心数据库的数据量是百万级、千万级或是千亿级,所有的实体和关系都可以立即维护自身指标的计算和监控。
这时,本体就不只是“学术概念”,而是企业知识系统的语义骨架。
简单说,本体回答的是这样几个问题:
- 后续查询、分析、推理、决策,应该基于什么统一语义来展开。
如果说知识图谱是“把事实连起来”,那么本体就是“定义这些事实为什么成立、应该如何被解释”。
因此,现代本体平台的价值,不只是建模,更是把“数据”转换成“可计算的业务语义”。
二、行业趋势:本体正在从“建模层”走向“应用层”
最近,有一些本体建模工具正在被企业关注,如:protégé,但你还需要结合很多的外部组件来,要补齐 Protégé 的短板,实现类似 OntoFlow 或是 Palantir 平台能力 “数据接入→建模→存储→查询→推理→服务→Agent 调用→决策” 的完整闭环,需构建四层技术栈:建模层(Protégé)+ 数据层 + 存储 / 查询层 + 服务 / 执行层。从 Palantir 最近两年的公开方向很清晰,本体不再只是“语义建模工具”,而是面向应用、Agent 和决策系统的统一语义层,从最近公开的产品方向可以看到一个非常明显的变化:
过去,企业做本体,更多是为了统一语义和支持分析,如 知识中台;
现在,本体正在成为应用开发、Agent调用和业务执行的底座,正接近于完整的技术闭环。
例如,Palantir 最近强调三件事:
- 通过 OSDK,把 Ontology 直接变成前端和后端应用可以调用的开发接口。
- 通过 Ontology MCP,把对象、动作、查询暴露给 AI Agent,使图谱不只是“可看”,而是“可调用、可执行”。
- 通过更细粒度的权限与治理机制,让本体成为真正可进入生产环境的企业能力层。
这说明行业已经不满足于“画一个图、存一份 RDF、跑几条查询”,而是在追求一条更完整的链路:
数据接入 -> 语义建模 -> 图谱沉淀 -> 查询与动作 -> 智能体协同 -> 业务决策闭环
OntoFlow 的价值,也正是在这条链路上。

三、OntoFlow 的核心思路:把本体建模变成工作流
这也是Onto->Flow 的名字由来,OntoFlow 当前的本体建模平台,以工作流方式组织整个知识构建过程。平台围绕 4个固定节点展开:
这不是简单的 UI 排布,而是把传统上分散的知识工程步骤串成了一条明确的生产线。数据源可以是任意的源端系统,批量/增量/实时数据流源源不断的摄入,经过数据处理代码得到规范的本体“原料”后映射成 知识图谱/动态图谱,最终在“本体库”中实现业务动作。相比于:元数据管理系统 -> 数据治理 -> 数据中台 -> 知识中台 -> 指标中台/AI平台 的传统技术路线,OntoFlow 不需要整合多种系统,都在一个工作流中做完所有的事情。

在 OntoFlow 中,我们不再把“本体设计”理解成独立的建模动作,而是把它放在真实数据链路中去完成:
- 最终沉淀为本体库,并为查询、应用接口、后续推理留下统一入口
这意味着 OntoFlow 更适合企业场景中的**“连续建模”与“边验证边演进”**。
而不是用 AI 一次性把所有事情都做完,当下AI做不到(注意不是实体与关系抽取哦,或者从非结构化数据中抽取本体,这在几年前 Bert算法 的年代就已经可以完成),但是未来趋势,也是使用 OntoFlow 这条流水线具有成功案例后,我们可以让 AI 借鉴企业的成功经验,扩展更多的业务,它是一个人工越来越少,AI 出力越来越多,持续进化的过程。
四、第一步:数据选择,从业务范围开始,而不是从技术表开始
在做任何一个项目之前,首先要回答一个问题:这次要解决什么业务问题。
OntoFlow 的第一步不是直接拉数,而是先做“数据选择”。
这里的重点,不是把所有数据一股脑接进来,而是界定本次建模任务的边界。
例如,在设备运维、供应链、科研管理、政务治理等场景里,我们首先要明确:
在这个阶段,OntoFlow 更强调“结构探查”而不是“大规模拉取”。
平台支持对接企业现有数据源,对表结构、字段、基本分布进行识别,为后续建模提供输入边界。
![[此处可插入截图:数据源接入页 / 数据选择页]](https://api.ibos.cn/v4/weapparticle/accesswximg?aid=138172&url=aHR0cHM6Ly9tbWJpei5xcGljLmNuL3N6X21tYml6X3BuZy85WERXWE1ySGt0cmlhcmx6RlRPUnVHcWlhWVRZdjRTdTg2U29qaWNScnF3UjBVTU9tTlJnWkdMVU1uaWFVd1VoaWNEaWFEMmhIaWE2a3RZQ2dUZ01sS0tFa1BpY0ZqblJpYldxaWM2d0xWNDZCU2pPaWFMelRjLzY0MD93eF9mbXQ9cG5nJmFtcA==;from=appmsg)
选择数据后,可以点击查看数据的预览。

在开发阶段,你可以输入业务描述,执行节点让 AI 生成符合业务需求的测试数据,避免大规模源端系统的数据进入,你可以等建模完成后再接入数据,可以批量加载历史数据,也可以流式实时增量获取,也可以在线接口获取。

这样做的好处是,团队可以先从“理解数据世界”开始,而不是一开始就陷入复杂的数据搬运和治理成本中。
五、第二步:数据源表,把表结构变成可建模输入
完成数据选择后,OntoFlow 进入“数据源表”阶段。
这一阶段的关键目标,是把原始数据库里的“表和字段”,转换为后续建模可用的结构化输入。平台支持围绕具体数据源和数据表,完成以下工作:
这里有一个非常重要的理念: 数据库里的表结构不等于业务语义结构。
表可能是按系统实现拆分的,字段命名也可能带有强烈的历史痕迹。OntoFlow 在这一层的作用,是把“系统结构”整理成“语义建模的前置输入”。
![[此处可插入截图:表结构探查、字段选择、规则配置]](https://api.ibos.cn/v4/weapparticle/accesswximg?aid=138172&url=aHR0cHM6Ly9tbWJpei5xcGljLmNuL3N6X21tYml6X3BuZy85WERXWE1ySGt0b2NwMnFIS3NJWHhDZ2liZkxsREhsbHJCeVoyU3hJUnU4ZWtFdU9ZYnZtd3k3cnhqOGhJWFFkQ2ppYk9LeXFpYmUxWUR2Q2UxN21jd1BhNU43OVV4MmdkdUU5d0RzSjlJSVVTdy82NDA/d3hfZm10PXBuZyZhbXA=;from=appmsg)
这样,后续的本体设计就不是凭空定义概念,而是建立在真实数据骨架之上。
六、第三步:数据处理,让原始数据变成可进入图谱的知识材料
数据不能直接进入本体建模,是企业项目里最常见的现实。
原因很简单:
因此,OntoFlow 把“数据处理”单独设计为一个关键节点。
在这个阶段,平台面向后续图谱建模进行清洗、规范化、结构转换和衍生处理,例如:
这一步非常像传统 ETL,但目标不同。
ETL 更多是为数仓服务,而 OntoFlow 的数据处理是为“语义映射”和“图谱构建”服务。
也就是说,我们不是只关心“数据能不能进库”,而是更关心“数据能不能映射成一个稳定的业务对象”。
![[此处可插入截图:数据处理节点配置、处理结果预览]](https://api.ibos.cn/v4/weapparticle/accesswximg?aid=138172&url=aHR0cHM6Ly9tbWJpei5xcGljLmNuL3N6X21tYml6X3BuZy85WERXWE1ySGt0b1hoaWNCNTluemtiM2xBaWN0NDFkbUhDeWd5cFhFYWt4OGliN0J0SWJkMHlpY09pY0FycDdXSGxya2tidm1sMVZ6R1Qzckh4S3A1VkphS0JpY05EUVZ0S0tRZW84T2RHVWxBMlg2Yy82NDA/d3hfZm10PXBuZyZhbXA=;from=appmsg)
数据处理节点采用自然语言输入,AI 将生成代码并完成数据的转换工作,所以我们不需要写代码,只需要把业务逻辑描述清楚。

执行 AI 生成的代码后,我们可以看到结果数据,结果的好坏可以认为判别再使用 AI 优化。

七、第四步:子图建模,OntoFlow 的核心价值所在
如果说前面三步是在准备材料,那么“子图建模”就是 OntoFlow 的核心生产环节。
为什么不是一上来直接建全局图谱?
因为真实企业知识世界通常过于复杂,不适合一次性完成全局设计。更合理的方法,是按领域、按主题、按任务拆分为多个可复用的子图。
所谓“子图建模”,可以理解为:
围绕某一类业务对象、业务关系或分析任务,定义一组稳定的实体、关系、属性和计算逻辑。
例如:
在 OntoFlow 中,子图建模不是停留在“手工画关系”的层面,而是已经进入较工程化的设计方式。平台支持围绕建模对象定义:
这意味着 OntoFlow 不是只帮你“描述图谱”,而是开始支持“让图谱逻辑可执行”。
1. 从字段到属性
平台可将前序数据处理结果映射为实体属性或关系属性,让字段不再只是表列,而成为业务对象的可解释特征。
2. 从记录到对象
通过对象描述、对象类型和对象信息配置,原始记录可以被提升为“对象实例”的候选来源。
3. 从规则到函数
OntoFlow 支持为子图建模过程定义聚合函数和动作函数,这一点很关键。
因为很多知识图谱系统能建关系,但不能很好表达“如何计算”和“如何触发业务语义动作”。而在企业场景里,很多高价值知识并不是静态事实,而是通过规则、聚合、状态判断生成的。
4. 从模型到验证
平台已经支持建模代码查看、Schema 查看、单元测试生成与执行,这让本体建模开始具备“可验证、可回归”的软件工程特征。
如系统截图所示,从数据到知识图谱,其实你不需要做任何操作就可以映射为一张静态图谱:

如果你需要把知识图谱变成动态图谱,OntoFlow提供了两种模式:静态图谱、本体图谱,你可以根据业务需要选择模式,动态的模式可以设置符合“本体论”架构的函数和行动:

其中,函数是一个代码,用于实现你的业务逻辑,你的业务逻辑可以是一个公式,也可以是一个业务模型:

函数也采用 AI Coding 的方式进行,你只需描述你的业务逻辑,Agent自动识别输入和输出为你完成代码的编写并运行测试,函数遵循本体数据库 AbutionGraph 的开发规范。
同理,Action也是一种函数,它一般用于执行复杂操作,它可以定义行动执行的条件(当xxx大于xxx时),然后执行动作(可以是调用Agent,也可以是调用API,也可以是做回写),与 Palantir 平台功能一致,OntoFlow 的函数也可以选择流式实时和异步执行两种模式,用于区分实时任务和响应时间很长的任务。
子图建模完成后,你可以校验正确性,也可以直接执行查看生成的实体/关系数据是否已经遵循了本体数据库 AbutionGraph 的规范:

经数据对象到静态图谱,再到具有函数能力的动态图谱,都在一个建模阶段完成,这是 OntoFlow 与很多“图谱展示型工具”的关键区别: 它把本体建模从“图形编辑”推进到了“模型工程”。
八、第五步:本体库,把多个子图沉淀为可复用的语义资产
子图建模完成后,就进入“本体库”阶段。
本体库不是简单的数据落库,而是把前面定义好的语义结构、对象关系和建模结果统一沉淀下来,形成可查询、可扩展、可复用的图谱基础设施。
在 OntoFlow 的产品逻辑中,本体库承担三个角色:
这一步的意义非常大。
因为企业做本体,如果没有“库”的概念,最终很容易退化成一次性的项目制资产;
而一旦形成可维护的本体库,它就能逐步积累成组织级知识底座。
![[此处可插入截图:本体库节点、图谱结构预览]](https://api.ibos.cn/v4/weapparticle/accesswximg?aid=138172&url=aHR0cHM6Ly9tbWJpei5xcGljLmNuL21tYml6X3BuZy85WERXWE1ySGt0cmliNXNoRFJJYTR1bmd5d0NkWHB5WU9la2lhUVU3MkJqZUhVbmVTbHBtd255ZGljd2ptSFJFQTZLSHB4Y0VDaWFvbVQwWmxpYWhqRnFUZjRSSjFoQ2ljSVJkUXl2d3gxUm1hc1QxTS82NDA/d3hfZm10PXBuZyZhbXA=;from=appmsg)
更进一步,本体库也意味着企业可以逐步形成:
九、从本体库到图查询构建:让知识真正进入业务使用
很多图谱项目停在“图建好了”,但真正被业务使用,至少还要往前再走一步:
让图谱能力变成查询能力、接口能力和应用能力。
OntoFlow 在本体库节点之后,已经具备“图查询构建”的产品雏形。当前平台支持围绕本体库配置图查询定义,包括:
这说明 OntoFlow 的目标并不是把本体建模停留在“知识表达层”,而是继续向“知识服务层”推进。
换句话说,构建完本体图谱后,除了行动函数是事件驱动的,你还可以图查询的方式定义业务接口,直接面向应用程序,平台正在打通下面这条链路:
本体定义 -> 图查询 -> 服务接口 -> 智能体调用 -> 业务决策支撑
这也是今天行业发展的主方向。
本体不应该只是被专家维护的静态资产,而应该成为被业务系统、分析服务、AI助手和决策流程共同消费的语义底座。
![[此处可插入截图:图查询定义、代码生成、测试结果、API开关]](https://api.ibos.cn/v4/weapparticle/accesswximg?aid=138172&url=aHR0cHM6Ly9tbWJpei5xcGljLmNuL3N6X21tYml6X3BuZy85WERXWE1ySGt0b1FYSkFVcEtPM0R1b2lhNDhQNE0ydmtIaWNGc0pYbmdHaWJ5QWlibzRVczRteWM2SkM4NnZyd1BrdTc2Sk1UOEk3emtKWHlraWJCN0dKV2ZPaWFUSmljRTVrZXRQeVRpYW4yeE5sMXhZLzY0MD93eF9mbXQ9cG5nJmFtcA==;from=appmsg)
十、关于查询与推理:OntoFlow 当前的现实与演进方向
需要坦诚地说,查询和推理往往是本体平台里最难、也最需要长期打磨的部分。
OntoFlow 当前更成熟的能力,已经集中在:
而更深层的能力,例如:
这些通常需要在真实场景中持续演进。
但从平台路径看,OntoFlow 已经具备了很好的基础。因为一旦“数据处理 -> 子图建模 -> 本体库 -> 图查询”这条链路打通,后续的推理增强、语义检索增强、Agent 接入、决策自动化,都会更自然地建立起来。
换句话说,OntoFlow 当前已经搭好了“本体工程”的主骨架,查询和推理将是在这条骨架上持续增强的高阶能力层。
十一、结构化数据之外:面向非结构化数据的本体抽取空间
除了结构化数据,企业还有大量非结构化数据,例如制度文档、研究报告、设备手册、会议纪要、案例材料等。
这些内容往往蕴含了大量静态本体信息,例如:
对于这一类内容,OntoFlow 同样具备很好的扩展空间。
比较理想的方式是结合 AI 抽取能力与已有知识库,对文档中的概念、属性、关系和规则进行抽取,再回填到本体建模流程中,形成“非结构化知识 -> 静态本体 -> 图谱语义层”的补充链路。
这会让平台不只是处理“数据库里的事实”,还能吸收“文档里的知识”。
十二、为什么说 OntoFlow 是“从数据到决策”的平台,而不只是“建图工具”
如果只看表面,很多人会把本体建模平台理解为一个更复杂的图谱编辑器。
但从实际链路看,OntoFlow 的定位明显更完整:
- 它强调数据处理与语义转换,而不是直接把表映射成点边。
- 它把查询、测试、API、MCP 等能力逐步接到本体之上。
- 它最终服务的不是“图本身”,而是业务理解、系统协同和决策支持。
因此,OntoFlow 的核心价值可以概括为一句话:
它把企业知识建模从“离散工具链”变成了“连续工作流”。
十三、结语:企业知识工程,需要一条真正可落地的主线
企业真正需要的,不只是一个能画图的系统,也不是一个只能做学术表达的本体编辑器。
企业需要的是一条能落地、能演进、能支撑应用的知识工程主线。
OntoFlow 正在尝试把这条主线清晰地建立起来:
从数据选择开始,理解数据边界;
通过数据源表和数据处理,完成结构准备;
通过子图建模,定义实体、关系、属性和函数;
通过本体库,沉淀统一语义资产;
再通过查询构建、接口开放与后续推理增强,把知识真正送入业务系统和决策流程。
这也是 OntoFlow 本体建模平台最值得关注的地方。
它不是把“本体”做得更抽象,而是把“本体”做得更工程化、更流程化、更接近真实业务。
对于希望打通“数据 -> 知识图谱 -> 本体 -> 决策”链路的团队来说,OntoFlow 提供的,不只是一个平台,而是一种更贴近企业落地的方法。
最后,OntoFlow本体平台 及 AbutionGraph本体数据库 都个作者开发(一个人哦),AbutionGraph在过去7年中已经有过很多大型应用,但这套技术体系在Palantir火起来之前个人无法去推动一套新的技术范式,所以开源的几年少有人真正关心底层,也都是停留在使用底层技术定制化开发,如:

对于 OntoFlow的出现,是面向企业知识建模的简易工作流式本体平台,用流程把数据接入、子图建模、本体沉淀、查询验证和决策接口串成闭环。是对底层基座的封装,也是在让技术更靠近用户侧,该平台还在持续优化中,欢迎感兴趣的小伙伴加我v:biiyuzhe