微信扫码
添加专属顾问
我要投稿
AI Skill为何成为AI Agent的灵魂?从Prompt到Skill的跃迁,不仅是技术升级,更是从对话助手到执行伙伴的本质转变。核心内容: 1. 从ChatBot到Agent:Skill与Prompt的本质区别在于执行能力 2. Skill的构成与核心:以SKILL.md文件为核心的文件夹形态 3. 从使用到创建:如何构建自己的Skill,以及实用案例解析
AI Agent 慢慢进入我们的生活之后,
我们开始越来越频繁地听到一个词,Skill。
文章写作 skill、网页设计 skill、ppt生成skill,
甚至还有巴菲特skill,芒格skill,马斯克skill,前任skill,同事skill,老板skill。
还有另一个经常一起出现的词,MCP。
这俩放在一起,很多人直接懵了。
MCP我还没搞懂,又来个Skill。。。
Skill 到底是什么?
它是不是就是长一点的Prompt(提示词)?
Prompt、Skill、MCP 到底有什么区别?
MCP 和 Skill 是互相替代,还是互补?
我不会代码,能不能用 Skill?
如果我想做自己的 Skill,具体怎么做?
这期内容,Skill 是什么,有什么用,为什么需要,怎么创建自己的Skill,SKill和Prompt、 MCP 有什么区别,有哪些实用有趣的Skill?
一次讲清楚。
先说一个最重要的判断。
Skills 的完整名字,叫 Agent Skills。
注意这个 Agent。
它不是为了显得高级随便加上去的。
它告诉我们,
Prompt 是给 Model 用的,Skill 是给 Agent 用的。
这句话非常关键。
过去我们说提示词,大部分时候是在说,
你给一个模型发一段话,
模型根据这段话,给你回一段话。
它能分析,能总结,能写作,能给建议。
但它主要还是在对话。
这叫 ChatBot 场景。
而 Agent 不一样。
Agent 不只是会说话。
Agent 还能动手。
它可以使用工具,读文件、写文件、运行脚本、调用 API、访问数据库、生成图片、修改代码、把结果保存到本地。
所以 Skill 的重点,不是「这段文字比 prompt 长还是短」。
真正的重点是,
这段文字不是临时写给ChatBot让它回复你另一段文字的,
而是提前储备给一个能动手的 Agent ,在需要用的时候主动复用,
然后给你一个切切实实的产出成果的。
举个特别直观的例子。
你想让 AI 生成一篇文章的所有插图。
如果你把一段插图提示词和文章内容发给 ChatBot,
它可以帮你分析文章,
可以生成图片,
但它不会帮你放到文章里。
这些活,还是你自己干。
但如果这个任务交给 Agent,
它可以自己读你的文章文件,
设计每张图的内容和风格,
调用画图模型生成图片,
把图片插入正确位置,
最后输出成品。
这就是区别。
ChatBot 只能对话。
Agent 能动手干活。
所以,即使Skill里也会出现提示词,但这和Prompt的定位已经完全不同。
Skill最朴素的形态,就是一个文件夹。
文件夹的名字就是这个skill的名字。
这个文件夹里,至少有一个文件,
叫 SKILL.md,这是一个markdown格式的文档,可以直接用记事本打开编辑。
SKILL.md 里面写什么?
写这个 Skill 叫什么,什么时候应该用,具体该怎么做,输出应该长什么样,遇到问题怎么办。
如果复杂一点,
这个文件夹里还可以放脚本代码、参考资料、模板、图片、示例文件。
所以你可以先把 Skill 理解成,写给 Agent 的一份工作说明书。
一个最简单的 Skill,可以简单到什么程度?
比如掷骰子这个Skill。
---name: 掷骰子description: 借助随机数生成器进行掷骰子操作。当需要掷骰子时可使用该技能。---要投掷骰子,请使用以下命令,该命令会生成从 1 到指定面数之间的随机数字:bash,执行:echo $((RANDOM % <sides> + 1))powershell,执行:Get-Random -Minimum 1 -Maximum (<sides> + 1)将 <sides> 替换为骰子的总面数,例如标准骰子填 6,二十面骰子填 20。
你看,这东西就这么简单。
上面三条横线包起来的部分,
是元数据,又叫前置参考材料。
name 告诉 Agent,这个 Skill 叫什么。
description 告诉 Agent,什么时候应该用这个Skill。
下面的正文,
告诉 Agent 具体怎么使用这个Skill。
注意,它不是让模型自己给你说「一个随机数」。
它是告诉 Agent,
去用一个命令工具随机生成一个数。
这就是 Agent Skills ,不是只会说,而是能调用环境里支持的工具去做。
一个复杂 Skill,又可以复杂到什么程度?
比如 Anthropic 官方仓库里这个做 ppt的 Skill。
它就不是只有一个 SKILL.md。
它的目录里有 SKILL.md,
还有 scripts 文件夹,
还有其它md文件,
甚至还有许可证文件LICENSE.txt。
这说明什么?
说明复杂 Skill 不是一段超长提示词。
它更像一个小型工具包。
SKILL.md 负责告诉 Agent,
什么时候用这个 Skill,
任务大概的流程是什么。
editing.md 负责讲怎么编辑现有 PPT。
pptxgenjs.md 负责讲怎么用某个脚本代码库生成新的PPT。
scripts 负责放那些需要确定性执行的代码。
Agent 不需要一开始把所有东西全读进来。
它用到哪一步,
再读哪一份材料,
再跑对应脚本,
这叫渐进式披露。
这就是 Skill 真正和普通 prompt 拉开差距的地方。
不是只有一个提示词文本,还有其它各司其职的提示词文本,还有脚本代码,它关注的是一个任务的完整执行过程。
并且只会在需要的时候加载需要的材料,执行需要的脚本,这比把所有东西都放到一个文本里,喂给大模型,要省去很多token和上下文的占用。
不仅是这样,也会避免因为上下文太长,导致Agent遗忘你最初的要求。
Agent 使用skill的过程是这样的,比如这个ppt生成skill,
Agent一开始不会把所有 Skill 的全部内容都塞进上下文。
它只先看到每个 Skill 的名字和描述。
等用户的任务真的匹配某个 Skill,比如ppt生成skill,
它才会去看这个 Skill 的 完整SKILL.md。
如果 SKILL.md 里写,
编辑 PPT 再看 editing.md,
它就到那一步再看这个md。
scripts里的脚本也一样,需要用什么脚本,Agent才会去用。
这就像你入职公司,
第一天不会把财务制度、法务合同、技术规范、所有历史项目文档全背一遍。
你只需要知道,
遇到报销看报销手册,
遇到合同找法务模板。
Skill 也是这样。
需要什么,才打开什么。
这也是为什么传统提示词模板很难替代 Skill。
提示词一发出去,
基本就是全量加载。
你写了 2 万字,它就吃掉 2 万字上下文。
但 Skill 可以只先加载几十个 token 的 name和description。
真正用到的时候,
再加载正文部分的说明。
再需要的时候,
才读参考资料和脚本。
所以 Skill 的价值不只是「能不能做到」。
而是管理成本、复用成本、上下文成本、迭代成本完全不同。
简单说,
Skill 是提示词的工程化封装。
它让一段经验变得可复用、可组合、可迭代、可按需加载。
那 Skill 有什么用?
最直接的用处,是让 Agent 更稳定的帮你干活。
很多人用 Agent 最大的痛点不是它完全不会,
而是它今天会,明天不会。
今天写得还挺像人,
明天突然开始官腔。
今天格式对了,
明天又忘了。
Skill 就是用来解决这个问题的。
你把标准写进去,
Agent 每次做同类任务之前都去看一遍。
稳定性就会提升很多。
第二个用处,是把你的工作经验沉淀下来。
比如你每周都要写周报。
你其实知道,
哪些事情要写成结果,
哪些事情只能写成进展,
哪些风险必须单独拎出来,
哪些表达老板不喜欢。
但这些东西都在你脑子里。
你每次让 AI 写周报,
都得重新说一遍。
做成 Skill 之后,
你只需要把零散工作记录丢进去,
Agent 就按你的周报标准来整理。
这件事很普通,
但真的很有用。
第三个用处,是让复杂任务可以拆开做。
比如你想做一个公众号文章写作 Skill。
SKILL.md 里写整体写作流程。
references(参考资料) 里放你的历史文章风格、标题方法论、选题标准。
assets 里放封面模板。
scripts 里放字数统计、禁用词扫描、格式检查。
Agent 负责理解和写作,
脚本负责确定性检查,
参考资料负责提供风格约束。
这样一来,
它就不是单纯「帮我写篇文章」了。
它开始接近一条半自动内容生产线。
那 Skill 和 MCP 有什么区别?
这个问题特别重要。
因为现在很多人一听Skill,会觉得MCP是不是没用了。
MCP 解决的是连接问题。
Skill 解决的是怎么做的问题。
MCP 让 Agent 能够访问外部工具和数据。
Skill 告诉 Agent 在某个任务里,应该如何使用这些工具和数据。
看,这是两个不同层次的概念。
如果没有Skill,你每次要耳提面命八百遍,告诉你的Agent要使用哪些MCP工具,怎么使用这些MCP工具。
不然Agent可能选到错误的MCP工具组合,或者按错误的顺序使用了MCP工具。
如果没有MCP,Skill确实也能使用scripts里的脚本代码,或者系统自带的命令行工具来完成任务,但是它能触达的外部世界会受限。
你可以让 Agent 在本地处理文件、跑脚本、生成 PPT、整理 Markdown,但如果它要稳定访问数据库、飞书、Notion、GitHub、Slack、企业内部系统,或者各种远程 API,就需要一个标准化的连接层。
MCP 做的就是这件事,它把外部工具和数据源用统一协议接给 Agent,让 Agent 不用每次为不同服务单独写一套连接方式。
用一个最简单的类比。
MCP的全称是Model Context Protocol,也就是模型上下文协议。
就有点像电脑的USB接口和U盘统一遵循USB协议那样。
MCP负责把 Agent这台电脑, 和数据库、文件系统、浏览器、GitHub、飞书、Notion、各种 API ,这些U盘接起来。
接上之后,Agent 就能够得着这些外部资源。
但能够得着,不代表会用得好。
Skill 像操作手册和 SOP,它可以告诉 Agent,
什么时候要查数据库,查数据库时先看哪些表,哪些字段代表当前状态,哪些查询不能乱查,结果要怎么解释,异常要怎么处理。
对于简单的任务,
你可以不用skill,Agent直接自己决定调用什么MCP,一般也够用;
对于不涉及外部复杂对接资源的任务,
你也可以不用MCP,用一个skill解决问题也够用;
但是,涉及外部复杂对接资源,且流程复杂的任务,通常这些资源的提供方,比如飞书,Notion,都会提供MCP的使用方式,你就需要用Skill配合MCP了。
再看个具体例子。
你要让 Agent 分析公司内部谁的声望最高。
如果只有 MCP,Agent 可能能连上数据库,能查员工表、薪资表、部门表。
但它未必知道,「声望」应该怎么衡量。
看管理层级?看下属数量?看薪资?看任职时间?
这些不是连接问题,这是判断问题。
这时候就需要 Skill。
Skill 可以写清楚,分析声望时,先查管理关系,再查薪资水平,再查任职时长,以及其它具有相关性的数据,再组合成一个评分框架,最后输出结构化分析。
MCP 负责执行具体 SQL 查询。
Skill 负责告诉 Agent 为什么查、按什么顺序查、怎么解释结果。
这就是两者的分工。
所以 Skill 和 MCP 不是互替,它们是互补。
MCP 让 Agent 连接到外部世界的工具。
Skill 让 Agent 知道怎么组合工具完成任务。
那到哪里去找Skill呢?
这几个skill的网站,你可以自己去探索
https://www.skills.sh/
https://www.skillhub.club/
https://hermes-agent.nousresearch.com/docs/zh-Hans/skills
还有就是github.com上会有一些个人或团队开源的skill项目,可以自己根据需求去搜索。
这里说两点:
1.任何skill,如果不是官方的,都建议先用你的Agent检查一下安全性,方法也很简单,把skill的地址或者整个文件夹给你的Agent,跟它说检查一下这个skill的安全风险就行了。
2.任何skill的安装,除了skill网站提供的手动安装方法,都可以直接把skill的网址丢给你的Agent,比如claude code,跟它说帮我安装这个skill,你的Agent就会自己帮你安装。
有什么实用或者有意思的skill?
比如,你经常要做ppt,追求简洁、实用风格,可以试试Anthropic的pptx技能,
就是类似上面这张图的效果
安装方法也很简单,直接跟Claude Code说:“帮我安装这个skill,https://github.com/anthropics/skills/tree/main/skills/pptx“。
比如,你想搭建个人知识库,可以试试second-brain
安装方法也很简单,直接和你的Agent说:“帮我安装这个skill,https://github.com/NicholasSpisak/second-brain/tree/main/skills ”。
如果你还不知道这个前OpenAI创始团队成员 安德烈·卡帕西 提出的LLM Wiki个人知识库搭建方法,可以去看我那期讲LLM Wiki的内容,我自己现在一直也都在用。
再比如,人格蒸馏 Skill,这个就很有意思了。
GitHub 上有一个 awesome-persona-distill-skills 仓库,
专门收集围绕人物、关系、纪念性场景和方法论视角的 Agent Skills。
一句话讲就是:万物可蒸馏,而这个仓库收集了已经蒸馏好的万物。
比如,你不知道怎么和老板汇报,可以用「老板.skill」蒸馏你的老板,
https://github.com/vogtsw/boss-skills
你担心同事跑路、导师毕业、队友转岗,可以用「同事.skill」蒸馏他们,
https://github.com/titanwings/colleague-skill
你还可以用「前任.skill」
https://github.com/therealXiaomanChu/ex-skill
你也可以用「自己.skill」蒸馏你自己,
https://github.com/notdog1998/yourself-skill
或者直接使用蒸馏好的领域人物skill,
「巴菲特思维操作系统.skill」
https://github.com/will2025btc/buffett-perspective
「马斯克.skill」
https://github.com/alchaincyf/elon-musk-skill
「乔布斯.skill」
https://github.com/alchaincyf/steve-jobs-skill
「纳瓦尔.skill」
https://github.com/alchaincyf/naval-skill
如果以上都没有你感兴趣的,你还可以使用「女娲.skill」
https://github.com/alchaincyf/nuwa-skill
这里不是说完全还原一个人。
它更像是从公开作品、对话、经历和资料里,
提炼表达风格、决策框架、思考习惯和互动方式。
也就是把「一个人怎么想问题,怎么说话的习惯」,
做成一个可调用的方法论 Skill。
安装方法也很简单,直接和你的Agent说:
“帮我安装这个skill,<此处替换为对应的skill的网址>”。
还有一种Skill,叫元Skill。
元 Skill 不是某个具体任务里的 Skill。
它不是帮你写周报,
不是帮你生成图片。
它是帮助你发现Skill、创建Skill 的 Skill。
现在最典型的两个元 Skill,
一个叫 find-skills,
另一个叫 skill-creator
find-skills 解决的是,我想做一件事,到底有没有现成的 Skill?
以前我们找 Skill,可能要去 GitHub 搜,去 skills.sh 搜,去别人文章里翻推荐,
中间很容易打断当前工作流。
而 find-skills 可以直接在 Agent 里帮你搜索。
比如你对 Claude Code 说,
有没有 ppt 生成相关的 Skills?
它就会自己去帮你搜索,
还会结合 skills.sh这个网站的排行榜、来源信誉(官方、非官方)、GitHub stars,
帮你判断哪个Skill更靠谱。
安装方法也很简单,直接跟Claude Code说:“帮我安装这个skill,
https://github.com/vercel-labs/skills/blob/main/skills/find-skills “。
而 skill-creator 解决的是另一个问题,
我想做自己的 Skill,怎么从 0 到 1 做出来?
它不是简单帮你生成一份 SKILL.md。
更完整的流程是,
先问你这个 Skill 要解决什么问题,
什么时候触发,期望输出长什么样,要不要测试。
然后会自动帮你写一个技能草稿。
再设计几个真实测试任务。
跑一遍skill,让你看效果。
如果效果不好,就改。
再测,再改。
就是,我们跟着提示一步步来就能创建出一个skill了,不懂代码也完全没有问题。
安装方法也很简单,直接跟Claude Code说:“帮我安装这个skill,
https://github.com/anthropics/skills/blob/main/skills/skill-creator “。
什么时候需要创建自己的 Skill?
给一个特别简单的判断。
一件事你做了 3 次以上,或预判自己可能会做3次以上,
就可以考虑做 Skill。
不要做一个万能 Skill。
一个 Skill 解决一个具体的问题。
多个小 Skill,通常比一个巨大 Skill 更靠谱。
Skill 有风险吗?
有,而且必须认真对待。
因为 Skill 不一定只是文本。
它可能包含脚本代码,
可能要求读取文件,
可能调用外部服务,
可能引导 Agent 做一些操作。
所以别人发你的 Skill,
不要闭眼安装。
至少打开 SKILL.md 看一眼。
看看它要求 Agent 做什么。
如果里面有 scripts,
你又看不懂代码,
就别轻易运行。
不要把 API Key、密码、公司机密轻易写进 Skill。
也不要安装来源不明的 Skill 来处理敏感数据。
尽量看skill的安装量、来源是否可靠、GitHub 仓库的star数,进行综合判断。
Skill 是能力放大器,
好 Skill 会放大效率,坏 Skill 也会放大风险。
如果你觉得自己判断太麻烦,也可以让你的Agent,比如Claude Code或是别的,帮你检查。
为什么 Skill 如此重要呢?
当 AI 只是聊天工具的时候,
提示词就够用了。
但当 AI 变成执行者的时候,
它需要的不只是你临时说一句话。
它需要稳定的流程、边界、工具和规则。
这就是 Skill 的定位。
未来很多软件,可能都会发生变化。
过去我们打开网页,
自己点按钮、填表单、上传文件、等待结果。
以后很多任务,
Agent 可能直接通过 API 或 MCP 完成,
而 Skill 会告诉 Agent,
该怎么调用这些工具,该怎么整理输出。
网页是给人用的。
API 是给程序用的。
MCP 是给 Agent 连接外部世界的工具用的。
Skill 是给 Agent 学会怎么做事用的。
这几句话放在一起,
你就能看懂很多未来产品的形态。
人会不会有一天,被某个skill替代?
有可能。
已经有人在把前同事蒸馏成一个skill。
如果你正在做的事,是一个skill就能讲明白的,那么大概率会被替代。
如果不能,说明你的工作不只是机械式的动嘴,动手,你的工作需要调用你的思维。
史蒂芬·平克告诉我们:“人类的大部分思维其实并不以语言形式存在。”
迈克尔·波兰尼告诉我们:“我们所知道的远比我们能说出来的多。”
这说明语言并不全然是人类智慧,语言背后无法被完全言说的思维才是。
思 = 心上之田,在心上耕耘 =用心去想、去琢磨、去感受。
维 = 维度
当然,还有更高的维度,比如,四维 = 连续运动的体(加上了时间)
而语言,只是思维在低维空间的投影。
就像把三维立体图强行压扁成二维平面图,无论从多少角度刻画平面图,
都会丢失空间、质感、层次等关键信息,永远无法还原物体的本貌。
所以人的核心竞争力其实就两点,思维的高度和用语言还原思维的程度。
思维影响你的品味、洞察力、判断力、决策力和执行力,
语言影响你能在多大程度上让你的思维落地。
这里的语言不仅仅指说,也指写,也指画,也指弹。
思想维度高的人很难被AI替代,
如果乔布斯愿意加入你的团队,你不会只满足于用一个乔布斯.skill
不过我们不需要成为乔布斯,我们只要比周围人的思维高度高一点就够了。
如果有一天,公司让你蒸馏你自己,而这家公司有卸磨杀驴的先例,
可以用用这个skill
https://github.com/leilei926524-tech/anti-distill
蒸馏自己的skill后,丢给它,
它会帮你输出一份看起来完整专业、实际上核心知识已被抽掉的"清洗版"。
这是权宜之计,不是要我们躺平,
是为我们变得更强,争取时间,强到100个skill也不过是我们的冰山一角。
ok,到这里,
你已经知道 Skill 是什么,有什么用,和prompt、MCP的区别,有哪些实用、有趣的Skill,什么时候需要创建自己的skill,以及如何创建一个Skill。
你对 Skill 的理解,已经超过了 90% 的人。
以上,看到这里的你,一定很用心~
如果喜欢这篇内容,不妨点个赞 + 在看 + 转发,让更多人看到。
想第一时间收到我的更新,也可以给我星标🌟,不错过每一次推送。
感谢你的陪伴,我们下次再见。
/ 作者:再凝秋水
/ 互动交流,请联系邮箱:fennenqiushui@qq.com
53AI,企业落地大模型首选服务商
产品:场景落地咨询+大模型应用平台+行业解决方案
承诺:免费POC验证,效果达标后再合作。零风险落地应用大模型,已交付160+中大型企业
2026-05-24
小红书开始内测Red Skill,笔记下面也能挂AI技能了!
2026-05-24
开源|一款AI Prompt和Skill管理系统,支持多平台安装、版本控制与多模型测试
2026-05-24
Harness|15 Skills生态——从人工写skill到AI自己生成自己的知识资产
2026-05-24
这个Skill太香了!Karpathy说的AI写代码的毛病,直接治好
2026-05-23
装上这四个 skill,你日常工作更轻松
2026-05-22
一个循证医学框架,串起了我的5个医疗AI Skill
2026-05-22
我们用150个任务测试了30个skill,跑出7个反直觉结论
2026-05-22
Harness Engineering 实践与 Skills 打磨心得|开发者说
2026-04-05
2026-03-04
2026-03-05
2026-03-17
2026-03-03
2026-03-03
2026-03-17
2026-03-10
2026-03-26
2026-03-05