我要投稿

Skill Forge：我写的 AI Skill 工程化设计框架

发布日期：2026-05-10 23:52:32 浏览次数： 1560

作者：极寒AI科技生活

微信搜一搜，关注“极寒AI科技生活”

◆◆ 我为什么花时间写一个 Skill 设计框架

作为一个重度 AI Agent 用户，我每天和好几个 AI 编程助手打交道——OpenCode、Claude Code、Gemini。它们都有一个共同的能力：通过 Skill（技能包）来扩展行为。

但问题来了：写 Skill 这件事本身，就没有一个 Skill 来教你。

这就像一把锤子要打造自己一样——有点递归的荒诞感。我试过凭感觉写，结果 AI 经常跳过我的规则；我试过抄别人的格式，结果触发率惨不忍睹；我甚至试过把所有东西塞进去，结果 Token 爆了，AI 反而更懵。

写 Skill 不该靠感觉，该靠工程。

▲ Skill Forge — 从封面开始

▲ 写 Skill 的三大痛点：凭感觉、不触发、无法迭代

◆◆ Skill Forge 的核心思路

Skill Forge 是我自己写的一个 Skill 工程化设计框架。它的核心理念很简单：把「写 Skill」这件事本身，变成一个有方法论、可验证、可迭代的过程。

◆ 六条原则，解决六个具体问题

决策树路由：打开 SKILL.md，5 秒内知道下一步该做什么——不再面对空白文档发呆

渐进式披露：信息量与需求成正比。简单任务只看必要部分，复杂任务才展开细节

CLI 委托：确定性逻辑交给脚本处理，别让 AI 在正则匹配这种事上浪费 Token

验证闭环：每个动作都有检查步骤。写了规则？验证它是否被遵循

Token 压缩：表格代替段落，省 70% 的空间。SKILL.md 不是小说

边界表格化：用查找表代替散文描述，让 AI 精确匹配边缘情况

▲ 六大设计原则：每一条都来自实战踩坑

◆◆ 框架本身就是最好的 Skill

这点我觉得最有意思——Skill Forge 框架本身的 SKILL.md，就是它所教原则的最佳实践。

我在写这个框架的时候，就一直在用它自己的规则来约束自己：

1.决策树路由：SKILL.md 开头就是决策树，告诉你该用哪个子文档

2.Token 压缩：主文件控制在 500 行以内，详细内容拆到 references/

3.验证闭环：内置 trigger_eval.json，25 个测试用例自动评估触发准确率

4.进化日志：每次修改都记录到 evolution-log.md，下次迭代有据可依

如果你看完觉得「这框架写得还行」，那恰恰证明了这套方法有效——因为它就是用自己的方法写出来的。

▲ 七阶段完整生命周期：从需求发现到自我进化

◆◆ 大多数人跳过了最关键的一步

我观察到一个现象：大部分人写 Skill 直接从「起草」开始，跳过了前面的需求发现和意图采集。

这就好比你还没问用户想要什么功能，就开始写代码了。结果当然是——你猜的需求和用户真实需求对不上。

所以 Skill Forge 特别加了 Phase 0：需求发现。里面有四个实用的技巧：

投射法：假设你已经有了这个 Skill，你会怎么用它？倒推需求

否定法：列出「用户绝对不会说的话」，反面就是你的触发词来源

类比法：找已知的好 Skill 做类比，提取共性模式

场景还原：回忆你实际遇到的使用场景，拆解每一步的真实表达

这一步多花 10 分钟，后面少改 3 小时。真的。

▲ 自证设计 × 自我进化：CSO 触发优化 + 进化日志

◆◆ 一个 Skill 走天下？

这是另一个实战教训。OpenCode 用 ~/.config/opencode/skills/，Claude Code 用 ~/.claude/skills/，Gemini 用 ~/.gemini/skills/——路径不一样，配置格式也不完全一样。

早期我写的 Skill 只能在 OpenCode 上跑。后来想迁移到 Claude Code，发现一堆硬编码路径要改。所以我这次在 Skill Forge 里直接做了三平台支持：

.env.example：模板配置文件，git 跟踪但不含敏感信息

.env.local：本地实际配置，gitignore 忽略

变量化路径：~/{user_name}/$GIT_SKILLS_DIR 替代硬编码路径

现在一套 Skill 文件，三个平台都能用。

▲ 多平台支持：OpenCode / Claude Code / Gemini + 官方 skill-creator 集成

◆◆ 没有评估，就没有迭代方向

这是我踩过最大的坑之一。之前改完 Skill 就上线，然后……不知道变好了还是变差了。

Skill Forge 内置了一个评估系统：

trigger_eval.json：25 个测试用例（12 正样本 + 13 负样本），覆盖各种说法变体

方差分析：多次运行取方差，避免偶然性误导

skill-creator 集成：直接对接 Anthropic 官方评估工具链

有了数据支撑，每一次优化都有依据，而不是「我感觉这样更好」。

▲ 从「凭感觉」到工程化：用经过验证的模式产出高质量 Skill

◆◆ 最后说几句真心话

写 Skill Forge 的过程，其实就是一次「元 Skill」的实验——用一个 Skill 来教人怎么写 Skill。过程中遇到的每一个问题（触发不准、Token 爆炸、跨平台不兼容、无法衡量效果），都被提炼成了框架里的规则。

如果你也在为写 Skill 头疼，不妨试试。代码已开源在 GitHub，欢迎提 issue 和 PR。

53AI，企业落地大模型首选服务商

产品：场景落地咨询+大模型应用平台+行业解决方案

承诺：免费POC验证，效果达标后再合作。零风险落地应用大模型，已交付160+中大型企业

相关资讯

2026-05-11

Agent 的自我进化：从技能积累到 SkillOS 范式

2026-05-11

开源「伯乐Skill」，让你和Agent同时进化成AI热点懂王！

2026-05-11

npx skills : 最佳 Skills 管理工具完整指南

2026-05-10

从Prompt开始，讲透 Skills 的原理、实现与应用

2026-05-10

所谓Skill，不过是包装好的Prompt

2026-05-10

TS 大神 Matt Pocock 开源自己的 AI Skills，主打反 Vibe Coding

2026-05-09

Perplexity 是怎么设计、打磨和维护 Agent Skills 的

2026-05-09

Nacos Skill Registry：面向个人场景的 Skill 中心实践

联系获取

160+中大型企业正在使用53AI

立即咨询预约演示

把握AI发展的机遇，共同探索、共同进步

2025-01-22

如何打造基于GenAI的员工服务机器人

2025-01-22

热点资讯

开源「女娲.skill」，你现在可以去蒸馏任何人！

2026-04-05

Agent Skills：把提示词升级成“员工手册”，让 Agent 真正可复用、可规模化

2026-03-03

OpenCode进阶指南：MCP协议与Skill技能，让你的AI助手真正"开外挂"

2026-03-04

视频分镜提示词Skill，详细制作过程分享！

2026-03-17

OpenAI Codex Skills 深度技术解读

2026-03-05

Skills 真的可以帮我干活了：把工单分析变成一个可复用的 Skill

2026-03-03

OpenClaw 搭团队太折腾？这个 Skill 一键搞定多智能体协作

2026-03-10

当AI自己学会搭积木：Skills的崛起，会杀死Dify吗？

2026-03-17

🦞元宝派「养虾」常见问题答疑

2026-03-26

让你的 ClaudeCode 秒变 Openclaw（龙虾），连接飞书、Discord 远程控制

2026-03-05

大家都在问

怎么创建一个真正能干活的 Skills？

2026-05-09

Skill 是怎么悄悄变成 SOP 的?

2026-05-08

如何从0到1创建一个画原型的Skills？

2026-04-29

如何把经验装到Skills？

2026-04-29

你写的 Skill，及格了吗？

2026-04-22

万字干货！Harness Engineering如何工程化落地？

2026-04-22

如何用 Skills，高效完成产品经理的工作？

2026-04-18

装了N个skills之后，鹅厂员工觉得“最香”的是哪一个？

2026-04-15

热门标签

内容创作大模型技术个人提效 langchain llamaindex 多模态技术 RAG技术智能客服知识图谱模型微调 RAGFlow coze Dify Fastgpt Bisheng Qanything AI+汽车 AI+金融 AI+工业 AI+培训 AI+SaaS Skill 提示词技巧 AI+电商 AI面试数字员工 ChatBI AI知识库开源大模型智能营销智能硬件智能化改造 AI+医疗 MaxKB Palantir Glean Openclaw