微信扫码
添加专属顾问
我要投稿
Agent Skills的本质是什么?这篇文章用第一性原理拆解了LLM的核心能力与Agent Skills的关系。核心内容: 1. LLM的唯一核心能力是预测输出 2. Function Calling等功能的本质是特定格式的提示词 3. Agent作为代理如何连接用户与LLM能力
最近 Agent Skills 在网上炒得火热。
各种资源、各种教程、各种神奇的 Skill 分享,琳琅满目。
但你发现没有?看了一堆,还是云里雾里。
因为你没搞懂本质。搞不懂本质,你就只能一直索取别人的 Skills,永远是个"伸手党"。
今天,我用 1000 字讲清楚它的本质。
Anthropic(Claude 的开发商)是这么定义 Skill 的:
Agent Skills are modular capabilities that extend Claude's functionality.
翻译一下:Agent Skills 是扩展 Claude 功能的模块化能力。
补充解释是:
Each Skill packages instructions, metadata, and optional resources that Claude uses automatically when relevant.
关键词:扩展功能。
要理解"扩展",必须先理解"本体"——也就是 LLM 本身有什么功能。
从 2023 年火到现在,LLM 的核心能力其实只有一个:
预测输出。
你给它输入,它预测下一个 token,然后下一个,再下一个……直到输出完成。
就这么简单。
其他你听过的能力——什么 tools、function calling、联网搜索——本质上都是在这个能力上包了一层皮。
LLM 就是一个超级强大的"续写机器",所有花里胡哨的功能,底层都是让它"续写"出特定格式的内容。
既然说到 tools/function calling,有必要讲清楚。
这个功能其实就是一段提示词,大概长这样:
我有下面三个 tools:
- tool1: 功能1,参数1、参数2
- tool2: 功能2,参数1、参数2
- tool3: 功能3,参数1、参数2
当你解答问题 X 时,先检查 tools,看看哪个能解决。如果是 tool1,就返回
tool1(参数1, 参数2)这种格式。
实际还会复杂一些(tool id、多轮调用等),但本质就这样。
就是一段提示词,让模型按固定格式输出。
你看,LLM 开发商把常用能力包装成了 tools/function calling。叫什么名字随他们,你也拦不住。
有了上面的认知,我们来看 Agent。
LLM 开发商写了一个应用,这个应用调用"预测输出 + tools"的能力。可以是网页版,也可以是 Claude Code 这种 CLI 工具(终端,或称命令行)。
这个应用叫Agent。
Agent 这个词,准确翻译是"代理人、经纪人、媒介"。虽然现在大家喜欢叫"智能体",但"代理"更贴切。
代理什么呢?
代理你和 LLM 的交互周期。
原来,你需要:
prompt1 → 等 response1
根据 response1 补充 → prompt2 → 等 response2
根据 response2 补充 → prompt3 → 等 response3
……
直到第 5 轮,终于得到想要的结果 response5
而 Agent 让你只输入:
prompt1,中间全自动,直接拿到最终 response5。
Agent = 自动化循环 prompt 的人机中介。
到这里你已经理解了 70%。
现在你应该能猜到了。
Agent Skills = 把那些固化的流程、功能、注意事项,记录下来,打包成"技能包",方便以后复用。
就是这么简单。
你说不对,有些 Skill 能自动剪辑视频呢!怎么可能这么简单?
真是这么简单。
因为 LLM 知道怎么用某个 Python 库剪辑视频。它通过和 Agent 多次交互,在你本地部署这些库,编写脚本代码,然后执行。
整个过程你不会写代码、看不懂代码,但它就这样干了。
其他神奇的 Skill 也是如此。你觉得神奇,是因为你不知道网络上有现成工具能实现——而 LLM 知道。
举个例子。
我经常要评审公司的项目 SOW(.docx 文件),就跟 Agent 说:
帮我从项目计划、预算、验收和风险 4 个方面评审这个 SOW。
Agent 勤劳地做完了,效果可能还差点意思。毕竟它对我们公司理解有些,我给它的第一轮提示词也不完善。
于是,我继续补充:注意检查有没有日期、计划太紧张不合理的要提示出来。
Agent又勤劳的工作,直到我满意它的输出。
这时我说:把刚刚的过程提炼成 Skill。
然后它就生成对应格式的 Skill 文件。如果 Agent 不太"聪明",你就手动复制到指定文件夹。
下次再评审时,不用给重复的 prompt,你只要说评审这个SOW即可
你看,你完全不知道 .docx 文件是怎么被打开和解析的,你只要结果。过程保存为 Skill,下次直接用。
本质上就是这么简单。
Agent Skills 没有魔法。
它就是:提示词 + 固化流程 + 自动化调用。
揭开神秘面纱之后,你就能从"伸手党"变成"创造者"——自己根据需求,定制专属 Skill。
如果这篇文章让你"恍然大悟",点个在看让更多人看到。
你准备用 Skill 解决什么问题?评论区告诉我,说不定我能帮你设计一个。
这是「揭开 Claude Code 的神秘面纱」系列的第二篇。
53AI,企业落地大模型首选服务商
产品:场景落地咨询+大模型应用平台+行业解决方案
承诺:免费POC验证,效果达标后再合作。零风险落地应用大模型,已交付160+中大型企业
2026-01-28
MIT搞了个骚操作:让AI记忆力暴涨1000万倍,还更便宜了
2026-01-28
OpenAI凌晨放大招,免费Prism颠覆科研!从摘要到致谢,GPT-5.2包圆
2026-01-28
Agent Sandbox 深度解析:当 AI 学会“动手”,我们如何不被它“误伤”?
2026-01-28
从 Workflow 到 Skills:Claude出手,Dify 和 Coze 们的路还有多宽?
2026-01-28
谷歌推出的AI编程工具Antigravity,有五大杀手锏!
2026-01-28
对话MiniMax Agent团队:“没有Agent企业敢说自己有壁垒”
2026-01-28
Anthropic CEO两万字长文:2027,人类命运的十字路口
2026-01-28
Claude Code 浏览器自动化方案,怎么选?
2026-01-10
2025-11-19
2025-11-13
2026-01-24
2025-11-03
2026-01-01
2025-12-09
2025-11-12
2025-11-15
2025-11-21
2026-01-28
2026-01-28
2026-01-28
2026-01-26
2026-01-26
2026-01-23
2026-01-23
2026-01-22