2026年4月2日 19:30分,来腾讯会议(限30人)了解如何用Openclaw构建企业AI生产力
免费POC, 零成本试错
AI知识库

53AI知识库

学习大模型的前沿技术与行业应用场景


我要投稿

我用Harness Engineering实现【无人值守式】的产品开发运营

发布日期:2026-03-31 07:53:14 浏览次数: 1565
作者:产品二姐

微信搜一搜,关注“产品二姐”

推荐语

探索AI时代产品开发新范式:揭秘如何用Harness Engineering实现无人值守式开发运营。

核心内容:
1. Harness Engineering概念解析与三阶段演进路径
2. Book2Skills项目实战:从经典书籍提炼AI可执行方法论
3. 构建生产级AI系统的四步实践框架与核心要诀

杨芳贤
53AI创始人/腾讯云(TVP)最具价值专家

Harness engineering 是最近出现的新词,在这个时代,概念往往先于案例实践,目前 Harness engineering 还没有像提示词工程那样被广泛应用,案例也比较少。


今天就以我自己的产品为案例来说说我是如何理解、起步Harness engineering 的,给大家一个参考。

Harness Engineering寓意


Harness 一词原意是缰绳和马鞍,寓意是AI 这匹马很强大,但没有缰绳和马鞍,它就只会乱跑;而你,就是构建这些缰绳和马鞍的骑手。


今年初 OpenAI 发了一篇文章,描述他们的团队用 Codex 构建了一个超过百万行代码的生产级产品——零行代码由人类手写。工程师们不写代码,他们构建的是让 AI 可以可靠写代码的系统。


这个系统——文档、质量标准、约束、反馈循环——就是 Harness。


如果我们纵向对比 AI engineering 的几个阶段会更清楚:


阶段一: Prompt + workflow。单次调用 + 硬性编排,流程固定,灵活性差。
阶段二:上下文工程。支持长步骤推理和灵活编排,但过程中容易跑偏,需要人在旁边盯着。
阶段三:Harness engineering。无人值守运行。需要我们提前写好标准、原则、检验标准、工具架(Skills)这些"秘籍",AI 遇到问题去查这些文档即可。秘籍写得越好,harness engineering 的程度就越高。


接下来分享是如何在自己的项目 book2skills 里起步 harness engineering 的。

使用Harness Engineering开发Book2skills 


Book2Skills(https://book2skills.com/zh)的想法是:把经典书籍的核心分析方法提炼成 AI Skill——不是书的摘要和检索,而是方法论的"可执行版本"。安装之后,你可以直接在 Claude 里说:"用《怎样选择成长股》分析一下腾讯控股"。AI 会真正按照其中方法跑一遍分析逻辑,而不是复述书里的话。


Book2skills试图解决两个问题:

一是:大多数人读完一本书,记住的不超过 20%,真正用起来的更少,这是一种全新的读书方式。读书不如“用”书。

二是:对任何具体的问题,选定一本书,你就可以知道如何按照这本书中的方法来分析,拆解问题。 


Book2Skills本质上是一个skills工厂。 先说我是如何在Book2Skills里起步 harness engineering ,然后再说harness engineering 的结果。


构建harness engineering花了两天时间,分为四个步骤。每个步骤的产物(也就是Book2Skills 配套harness) 都是反复迭代生成的——80% 的时间都花在这上面。接下来一一介绍。

一、充分的 Requirement 编写


动手之前,先花两个小时把需求想清楚:让 AI 帮我找竞品、挖用户真正的诉求、梳理实施方法、寻找设计灵感。这个过程把脑子里模糊的判断,逼成了明确的文字标准,放在requirements.md里



二、构建合理大小的 Skill


这部分花的时间比较多,5小时,经历了三个步骤:


a) 先粗糙地把流程跑通,我最开始只给最简单的 PDF,输出最基础的 skill;

b) 再逐个 skill 精细化,一点点提升质量;

c) 最后做流程拆解——如果某个 skill 超过一定长度,就拆成两个。


最终得出book-skill的的生产流程:

「选书 → 读书 → 提炼 skill → 发布 GitHub → 生成 skill 效果示例 → 生成网站内容」


除了选书之外,所有的步骤都使用skill完成。如下图所示:




依次来介绍这些skill:


1. 总skill: book2skills-publisher。这可以理解为main skill,完成了对整个流程的编排。注意这里的编排不是 Coze 那种硬编排,而是纯文字描述的松散指令。这可以让执行过程不必完全遵循这个流程,AI 可以根据实际情况灵活判断。这也是 skills 比硬编码流程更精妙的地方。


2. 读书(read-book-skill):调用本地 Python 脚本逐章提取 PDF 内容,整理成结构化的 markdown 章节摘要。Claude Code 原生的 PDF 读取能力是这一步的基础。


3. 提炼 skill(book-skill-creator):基于章节内容,仿照 Anthropic skill-creator 规范,提炼出 SKILL.md——包含 frontmatter、skill 维度、查询响应框架、输出格式。这是影响 skill 质量最大的一步,也是后续会持续打磨的地方。


4. 打包 GitHub repo(write-skill-repo):以 SKILL.md 为输入,自动生成符合规范的 GitHub 文件夹:清理版 SKILL.md + README.md + LICENSE.txt,打包成 .zip,写入本地仓库。


5. 生成 skill 效果示例(book-skills-examples):市面上大多数 skill 看不到真实效果。我让 AI 真实调用 skill,结合 web search,生成完全真实的使用示例,中英文各跑 2-3 轮对话,带真实数据引用。读者看完示例,自己就能判断这个 skill 有没有用。




6. 生成网站内容(write-skills-page-content):把以上所有产出整合成网站页面,包括 skill 描述、使用示例、安装指令、下载链接,部署后直接在 book2skills.com 上线。


第三步:写一份锚定文档


第二步的流程跑通之后,项目轮廓基本出来了。在进一步精细化 skills 之前,我专门写了一篇"What is book2skills"的文档。它的真正作用不是对外介绍产品,而是给自己定边界——确保接下来的 skills 不会过度设计,不会跑偏。



四步:持续促进 Skill 的自我迭代


Skills 最大的优势是可以自我迭代,它改变了原有的编程方式,甚至我们现在可以用Skills来取代Langchain的地位。比如使用过程中,如果用户发现某个 skill 有缺陷,直接告诉它"把这条规则加进去",它会更新自己的文件,下次运行立即生效——不需要任何开发者介入。


事实上在我看来,真正让Harness Engineering能实现无人值守的本质就是:Skill可以被极其方便的并行迁移、自我迭代。


随着迭代积累,每个 skill 内部会沉淀出具体的 reference 和 spec——相当于师傅给徒弟留下的标准参照物和设计准则。徒弟遇到判断点去查这些文档,遇到质量问题去对照这些标准。这本"秘籍"写得越好,harness 就越强,实现无人值守的可能性也就越大。 而这个迭代的过程本身,也是可以自动化的!



完成以上步骤后,我们来看效果。

最终结果:一个全自动发布流水线


经过这四个步骤,我得到了一个全自动发布的工作流程,由 1 个主 skill、5 个子 skill 组成。只要我选好书籍,调用主 skill `book2skills-publisher`,剩下的等着就行。


让我惊讶的是,在我给到10本书籍以后,Agent还会自主并行启动任务。



到这里,book2skills的skill 生成和发布就完成了初步的harness化,不久的将来会把运营、UI、SEO 优化也陆续纳进来,这也是为什么你会看到以下skills在代码里。



写在最后


最后说几点感受:


1. Harness并不难,但它却极大程度把开发者从陪伴式编程中解放了出来。是高ROI的投资

2. Harness背后的驱动是skills的自我迭代,持续优化,使用合适的skills是前提。

3. Harnnss也并非一劳永逸,要经常维护。


当模型能力的发展开始变缓,我们会发现工程能力又开始以新的速度蜕变:从提示词工程,到上下文工程,harness 工程,每一次进化都让AI这项技术离应用越来越近。 

53AI,企业落地大模型首选服务商

产品:场景落地咨询+大模型应用平台+行业解决方案

承诺:免费POC验证,效果达标后再合作。零风险落地应用大模型,已交付160+中大型企业

联系我们

售前咨询
186 6662 7370
预约演示
185 8882 0121

微信扫码

添加专属顾问

回到顶部

加载中...

扫码咨询