我要投稿

开放知识格式（OKF）全面分析：AI智能体时代的组织知识标准化

发布日期：2026-06-21 09:39:04 浏览次数： 1526

作者：架构师之道

微信搜一搜，关注“架构师之道”

架构师之道

● AI · LLM · Agents | Enterprise Architecture | Digital Transformation

一、引言：OKF是什么？

2026年6月12日，Google Cloud正式发布了开放知识格式（Open Knowledge Format，简称OKF）0.1版。这是一套开放的、厂商中立的规范，用于表示组织内部的元数据、上下文和经过整理的知识，让人类和AI智能体都能直接读取。

OKF的核心主张极为简洁： 用普通的Markdown文件加YAML元数据头来表示知识。Google明确将其定位为“格式”而非“平台”——没有账号、没有SDK、没有厂商锁定，任何人用文本编辑器就能读写。

二、要解决什么问题？

2.1 上下文组装问题

在大多数组织中，AI模型需要的知识散落在互不兼容的系统中：

元数据目录（各有各的专有API）
内部Wiki、Notion、Confluence
代码注释和文档字符串
共享网盘中的PDF和Office文档
资深员工脑子里的“部落知识”

当一个AI智能体需要回答“如何计算周活跃用户数”时，它必须从这些互不兼容的来源中拼凑答案。每个团队都在从头解决同一个问题，知识被锁死在创建它的那个界面里。

2.2 现有方案的碎片化

过去一年里，开发者社区涌现出各种“LLM Wiki”模式——AGENTS.md、CLAUDE.md、Obsidian知识库——但每种都是定制化的，格式互不兼容，无法跨系统复用。OKF正是要填补这个空白：建立一套共同的约定，让不同生产者写的知识能被不同智能体消费，无需翻译层。

三、OKF核心规范解析

3.1 知识包（Knowledge Bundle）

一个OKF知识包就是一个目录树：

my_bundle/
├── index.md                  # 目录索引（可选）
├── log.md                    # 变更日志（可选）
├── datasets/
│   ├── index.md
│   └── sales.md
└── tables/
    ├── index.md
    ├── orders.md
    └── customers.md

每个非保留文件名的.md文件就是一个概念文档。index.md用于渐进式展示，让智能体先看目录再按需深入；log.md记录变更历史。

3.2 概念文档结构

每个概念（一张表、一个指标、一个API、一本运维手册）就是一个Markdown文件，包含两部分：

YAML元数据头（Frontmatter）：

YAML

---
type: BigQuery Table          # 必填
title: Orders                 # 推荐
description: 每行一个已完成客户订单  # 推荐
resource: https://...          # 推荐（底层资产URI）
tags: [sales, revenue]         # 推荐
timestamp: 2026-05-28T14:30:00Z # 推荐
---

唯一必填字段是type，用于标识概念类别（如Metric、Table、API、Runbook）。其余字段均为推荐项，消费者必须容忍缺失。

Markdown正文：

正文是标准Markdown，用于详细描述概念。可以用标题组织结构、表格描述Schema、代码块展示SQL示例。概念之间用普通Markdown链接相互关联，从目录中自然浮现出知识图谱。

3.3 设计原则

Google明确阐述了OKF的三个设计原则：

极简主义：
只强制type一个字段，其余全部由生产者自行决定。规范定义的是互操作界面，而非内容模型。
生产者/消费者独立：
生产者不需要知道消费者是谁，消费者不需要知道生产者是谁。格式是契约，两端的工具可独立替换。
格式而非平台：
不绑定任何云、数据库、模型或智能体框架。不需要专有账号，不需要SDK。

四、与LLM-Wiki模式的渊源

OKF并非凭空发明。它明确继承了Andrej Karpathy（OpenAI联合创始人）提出的“LLM-Wiki”模式。

2026年初，Karpathy在GitHub上分享了一个思路：与其让智能体反复查询相同文档，不如给它们一个共享的Markdown知识库，让智能体自己维护和更新。他观察到： 大语言模型不会厌烦，不会忘记更新交叉引用，一次处理就能覆盖15个文件——那些让人类放弃个人Wiki的维护性工作，恰恰是LLM擅长的。

这个思路在开发者社区迅速传播，但每个人都在自己的角落里重新发明轮子。OKF的价值就在于： 给这个模式加了一层标准化约定，让不同的“LLM Wiki”能够互操作。

五、OKF vs 其他标准

OKF与几个容易混淆的标准是互补而非竞争关系：

标准	消费方	存放位置	主要作用
schema.org / JSON-LD	搜索引擎	公开网页内	富媒体摘要、知识面板
llms.txt	AI爬虫和答案引擎	网站根目录公开文件	告诉智能体网站结构和重要页面
OKF	你自己的AI智能体	内部知识包（通常在代码仓库）	提供权威、结构化的组织知识

特别澄清：OKF ≠ SEO排名信号

OKF不会提升Google搜索排名。它不是公开网页格式，不是被全网爬取的发现标准，也不替代schema.org结构化数据。它是面向组织内部的：让你的智能体基于共享的权威知识运作，而不是每次都从零推导事实。

六、Google提供什么配套工具？

Google不止发布了规范，还提供了实际可用的参考实现：

知识增强智能体（Enrichment Agent）：
遍历BigQuery数据集，为每张表自动生成OKF文档草稿，再通过LLM补充Schema、关联路径和引用来源。
静态HTML可视化工具：
把任何OKF知识包转成交互式知识图谱，一个独立HTML文件，无需后端。
三个示例知识包：
GA4电商数据、Stack Overflow、Bitcoin公开数据集。

Google Cloud的Knowledge Catalog（原Dataplex）也已更新，支持直接接入OKF并服务于智能体。