我用Harness Engineering实现【无人值守式】的产品开发运营

发布日期：2026-03-31 07:53:14 浏览次数： 2201

作者：产品二姐

微信搜一搜，关注“产品二姐”

Harness engineering 是最近出现的新词，在这个时代，概念往往先于案例实践，目前 Harness engineering 还没有像提示词工程那样被广泛应用，案例也比较少。

今天就以我自己的产品为案例来说说我是如何理解、起步Harness engineering 的，给大家一个参考。

Harness Engineering寓意

Harness 一词原意是缰绳和马鞍，寓意是AI 这匹马很强大，但没有缰绳和马鞍，它就只会乱跑；而你，就是构建这些缰绳和马鞍的骑手。

今年初 OpenAI 发了一篇文章，描述他们的团队用 Codex 构建了一个超过百万行代码的生产级产品——零行代码由人类手写。工程师们不写代码，他们构建的是让 AI 可以可靠写代码的系统。

这个系统——文档、质量标准、约束、反馈循环——就是 Harness。

如果我们纵向对比 AI engineering 的几个阶段会更清楚：

阶段一： Prompt + workflow。单次调用 + 硬性编排，流程固定，灵活性差。

阶段二：上下文工程。支持长步骤推理和灵活编排，但过程中容易跑偏，需要人在旁边盯着。

阶段三：Harness engineering。无人值守运行。需要我们提前写好标准、原则、检验标准、工具架（Skills）这些"秘籍"，AI 遇到问题去查这些文档即可。秘籍写得越好，harness engineering 的程度就越高。

接下来分享是如何在自己的项目 book2skills 里起步 harness engineering 的。

使用Harness Engineering开发Book2skills

Book2Skills（https://book2skills.com/zh）的想法是：把经典书籍的核心分析方法提炼成 AI Skill——不是书的摘要和检索，而是方法论的"可执行版本"。安装之后，你可以直接在 Claude 里说："用《怎样选择成长股》分析一下腾讯控股"。AI 会真正按照其中方法跑一遍分析逻辑，而不是复述书里的话。

Book2skills试图解决两个问题：

一是：大多数人读完一本书，记住的不超过 20%，真正用起来的更少，这是一种全新的读书方式。读书不如“用”书。

二是：对任何具体的问题，选定一本书，你就可以知道如何按照这本书中的方法来分析，拆解问题。

Book2Skills本质上是一个skills工厂。先说我是如何在Book2Skills里起步 harness engineering ，然后再说harness engineering 的结果。

构建harness engineering花了两天时间，分为四个步骤。每个步骤的产物（也就是与Book2Skills 配套harness）都是反复迭代生成的——80% 的时间都花在这上面。接下来一一介绍。

一、充分的 Requirement 编写

动手之前，先花两个小时把需求想清楚：让 AI 帮我找竞品、挖用户真正的诉求、梳理实施方法、寻找设计灵感。这个过程把脑子里模糊的判断，逼成了明确的文字标准，放在requirements.md里

二、构建合理大小的 Skill

这部分花的时间比较多，5小时，经历了三个步骤：

a) 先粗糙地把流程跑通，我最开始只给最简单的 PDF，输出最基础的 skill；

b) 再逐个 skill 精细化，一点点提升质量；

c) 最后做流程拆解——如果某个 skill 超过一定长度，就拆成两个。

最终得出book-skill的的生产流程：

「选书 → 读书 → 提炼 skill → 发布 GitHub → 生成 skill 效果示例 → 生成网站内容」

除了选书之外，所有的步骤都使用skill完成。如下图所示：

依次来介绍这些skill：

1. 总skill： book2skills-publisher。这可以理解为main skill，完成了对整个流程的编排。注意这里的编排不是 Coze 那种硬编排，而是纯文字描述的松散指令。这可以让执行过程不必完全遵循这个流程，AI 可以根据实际情况灵活判断。这也是 skills 比硬编码流程更精妙的地方。

2. 读书（read-book-skill）：调用本地 Python 脚本逐章提取 PDF 内容，整理成结构化的 markdown 章节摘要。Claude Code 原生的 PDF 读取能力是这一步的基础。

3. 提炼 skill（book-skill-creator）：基于章节内容，仿照 Anthropic skill-creator 规范，提炼出 SKILL.md——包含 frontmatter、skill 维度、查询响应框架、输出格式。这是影响 skill 质量最大的一步，也是后续会持续打磨的地方。

4. 打包 GitHub repo（write-skill-repo）：以 SKILL.md 为输入，自动生成符合规范的 GitHub 文件夹：清理版 SKILL.md + README.md + LICENSE.txt，打包成 .zip，写入本地仓库。

5. 生成 skill 效果示例（book-skills-examples）：市面上大多数 skill 看不到真实效果。我让 AI 真实调用 skill，结合 web search，生成完全真实的使用示例，中英文各跑 2-3 轮对话，带真实数据引用。读者看完示例，自己就能判断这个 skill 有没有用。

6. 生成网站内容（write-skills-page-content）：把以上所有产出整合成网站页面，包括 skill 描述、使用示例、安装指令、下载链接，部署后直接在 book2skills.com 上线。

第三步：写一份锚定文档

第二步的流程跑通之后，项目轮廓基本出来了。在进一步精细化 skills 之前，我专门写了一篇"What is book2skills"的文档。它的真正作用不是对外介绍产品，而是给自己定边界——确保接下来的 skills 不会过度设计，不会跑偏。

第四步：持续促进 Skill 的自我迭代

Skills 最大的优势是可以自我迭代，它改变了原有的编程方式，甚至我们现在可以用Skills来取代Langchain的地位。比如使用过程中，如果用户发现某个 skill 有缺陷，直接告诉它"把这条规则加进去"，它会更新自己的文件，下次运行立即生效——不需要任何开发者介入。

事实上在我看来，真正让Harness Engineering能实现无人值守的本质就是：Skill可以被极其方便的并行迁移、自我迭代。

随着迭代积累，每个 skill 内部会沉淀出具体的 reference 和 spec——相当于师傅给徒弟留下的标准参照物和设计准则。徒弟遇到判断点去查这些文档，遇到质量问题去对照这些标准。这本"秘籍"写得越好，harness 就越强，实现无人值守的可能性也就越大。而这个迭代的过程本身，也是可以自动化的！