微信扫码
添加专属顾问
我要投稿
探索AI时代产品开发新范式:揭秘如何用Harness Engineering实现无人值守式开发运营。 核心内容: 1. Harness Engineering概念解析与三阶段演进路径 2. Book2Skills项目实战:从经典书籍提炼AI可执行方法论 3. 构建生产级AI系统的四步实践框架与核心要诀
Harness engineering 是最近出现的新词,在这个时代,概念往往先于案例实践,目前 Harness engineering 还没有像提示词工程那样被广泛应用,案例也比较少。
今天就以我自己的产品为案例来说说我是如何理解、起步Harness engineering 的,给大家一个参考。
Harness Engineering寓意
Harness 一词原意是缰绳和马鞍,寓意是AI 这匹马很强大,但没有缰绳和马鞍,它就只会乱跑;而你,就是构建这些缰绳和马鞍的骑手。
今年初 OpenAI 发了一篇文章,描述他们的团队用 Codex 构建了一个超过百万行代码的生产级产品——零行代码由人类手写。工程师们不写代码,他们构建的是让 AI 可以可靠写代码的系统。
这个系统——文档、质量标准、约束、反馈循环——就是 Harness。
如果我们纵向对比 AI engineering 的几个阶段会更清楚:
使用Harness Engineering开发Book2skills
Book2Skills本质上是一个skills工厂。 先说我是如何在Book2Skills里起步 harness engineering ,然后再说harness engineering 的结果。
构建harness engineering花了两天时间,分为四个步骤。每个步骤的产物(也就是与Book2Skills 配套harness) 都是反复迭代生成的——80% 的时间都花在这上面。接下来一一介绍。
一、充分的 Requirement 编写
动手之前,先花两个小时把需求想清楚:让 AI 帮我找竞品、挖用户真正的诉求、梳理实施方法、寻找设计灵感。这个过程把脑子里模糊的判断,逼成了明确的文字标准,放在requirements.md里
二、构建合理大小的 Skill
这部分花的时间比较多,5小时,经历了三个步骤:
a) 先粗糙地把流程跑通,我最开始只给最简单的 PDF,输出最基础的 skill;
b) 再逐个 skill 精细化,一点点提升质量;
c) 最后做流程拆解——如果某个 skill 超过一定长度,就拆成两个。
最终得出book-skill的的生产流程:
「选书 → 读书 → 提炼 skill → 发布 GitHub → 生成 skill 效果示例 → 生成网站内容」
除了选书之外,所有的步骤都使用skill完成。如下图所示:
依次来介绍这些skill:
1. 总skill: book2skills-publisher。这可以理解为main skill,完成了对整个流程的编排。注意这里的编排不是 Coze 那种硬编排,而是纯文字描述的松散指令。这可以让执行过程不必完全遵循这个流程,AI 可以根据实际情况灵活判断。这也是 skills 比硬编码流程更精妙的地方。
2. 读书(read-book-skill):调用本地 Python 脚本逐章提取 PDF 内容,整理成结构化的 markdown 章节摘要。Claude Code 原生的 PDF 读取能力是这一步的基础。
3. 提炼 skill(book-skill-creator):基于章节内容,仿照 Anthropic skill-creator 规范,提炼出 SKILL.md——包含 frontmatter、skill 维度、查询响应框架、输出格式。这是影响 skill 质量最大的一步,也是后续会持续打磨的地方。
4. 打包 GitHub repo(write-skill-repo):以 SKILL.md 为输入,自动生成符合规范的 GitHub 文件夹:清理版 SKILL.md + README.md + LICENSE.txt,打包成 .zip,写入本地仓库。
5. 生成 skill 效果示例(book-skills-examples):市面上大多数 skill 看不到真实效果。我让 AI 真实调用 skill,结合 web search,生成完全真实的使用示例,中英文各跑 2-3 轮对话,带真实数据引用。读者看完示例,自己就能判断这个 skill 有没有用。
6. 生成网站内容(write-skills-page-content):把以上所有产出整合成网站页面,包括 skill 描述、使用示例、安装指令、下载链接,部署后直接在 book2skills.com 上线。
第三步:写一份锚定文档
第二步的流程跑通之后,项目轮廓基本出来了。在进一步精细化 skills 之前,我专门写了一篇"What is book2skills"的文档。它的真正作用不是对外介绍产品,而是给自己定边界——确保接下来的 skills 不会过度设计,不会跑偏。
第四步:持续促进 Skill 的自我迭代
Skills 最大的优势是可以自我迭代,它改变了原有的编程方式,甚至我们现在可以用Skills来取代Langchain的地位。比如使用过程中,如果用户发现某个 skill 有缺陷,直接告诉它"把这条规则加进去",它会更新自己的文件,下次运行立即生效——不需要任何开发者介入。
事实上在我看来,真正让Harness Engineering能实现无人值守的本质就是:Skill可以被极其方便的并行迁移、自我迭代。
随着迭代积累,每个 skill 内部会沉淀出具体的 reference 和 spec——相当于师傅给徒弟留下的标准参照物和设计准则。徒弟遇到判断点去查这些文档,遇到质量问题去对照这些标准。这本"秘籍"写得越好,harness 就越强,实现无人值守的可能性也就越大。 而这个迭代的过程本身,也是可以自动化的!
完成以上步骤后,我们来看效果。
最终结果:一个全自动发布流水线
经过这四个步骤,我得到了一个全自动发布的工作流程,由 1 个主 skill、5 个子 skill 组成。只要我选好书籍,调用主 skill `book2skills-publisher`,剩下的等着就行。
让我惊讶的是,在我给到10本书籍以后,Agent还会自主并行启动任务。
到这里,book2skills的skill 生成和发布就完成了初步的harness化,不久的将来会把运营、UI、SEO 优化也陆续纳进来,这也是为什么你会看到以下skills在代码里。
写在最后
最后说几点感受:
1. Harness并不难,但它却极大程度把开发者从陪伴式编程中解放了出来。是高ROI的投资
2. Harness背后的驱动是skills的自我迭代,持续优化,使用合适的skills是前提。
3. Harnnss也并非一劳永逸,要经常维护。
当模型能力的发展开始变缓,我们会发现工程能力又开始以新的速度蜕变:从提示词工程,到上下文工程,harness 工程,每一次进化都让AI这项技术离应用越来越近。
53AI,企业落地大模型首选服务商
产品:场景落地咨询+大模型应用平台+行业解决方案
承诺:免费POC验证,效果达标后再合作。零风险落地应用大模型,已交付160+中大型企业
2026-03-31
如何评测Agent Skills?Anthropic给出了解决方案
2026-03-31
京东科技发布ClawTip 业内首个纯正A2A微支付基础设施来了!
2026-03-31
MCP没死,CLI大兴,Skill通吃,GUI变形
2026-03-30
我开发了一个 龙虾Skill,让亚马逊的五点描述从 54 分提升到了 98 分
2026-03-30
为什么一夜之间大家都在做 CLI?
2026-03-30
学习笔记:从 Agent 到 Skills — AI 智能体架构的范式转变
2026-03-30
飞书 CLI 开源了,为什么 AI Agent 时代,大家都在做命令行工具?
2026-03-29
值得用的Agentic Skills框架:Superpowers从安装到实战
2026-03-04
2026-03-03
2026-03-03
2026-03-10
2026-03-05
2026-03-04
2026-03-05
2026-03-02
2026-03-18
2026-03-17
2026-03-30
2026-03-30
2026-03-26
2026-03-23
2026-03-19
2026-03-17
2026-03-15
2026-03-05