免费POC, 零成本试错
AI知识库

53AI知识库

学习大模型的前沿技术与行业应用场景


我要投稿

第一性原理,1000字拆解 Agent Skills 本质

发布日期:2026-01-28 06:50:44 浏览次数: 1515
作者:AI Native启示录

微信搜一搜,关注“AI Native启示录”

推荐语

Agent Skills的本质是什么?这篇文章用第一性原理拆解了LLM的核心能力与Agent Skills的关系。

核心内容:
1. LLM的唯一核心能力是预测输出
2. Function Calling等功能的本质是特定格式的提示词
3. Agent作为代理如何连接用户与LLM能力

杨芳贤
53AI创始人/腾讯云(TVP)最具价值专家
ChatGPT Image 2026年1月22日 00_13_38

最近 Agent Skills 在网上炒得火热。

各种资源、各种教程、各种神奇的 Skill 分享,琳琅满目。

但你发现没有?看了一堆,还是云里雾里。

因为你没搞懂本质。搞不懂本质,你就只能一直索取别人的 Skills,永远是个"伸手党"。

今天,我用 1000 字讲清楚它的本质。


先看官方定义

Anthropic(Claude 的开发商)是这么定义 Skill 的:

Agent Skills are modular capabilities that extend Claude's functionality.

翻译一下:Agent Skills 是扩展 Claude 功能的模块化能力。

补充解释是:

Each Skill packages instructions, metadata, and optional resources that Claude uses automatically when relevant.

关键词:扩展功能。

要理解"扩展",必须先理解"本体"——也就是 LLM 本身有什么功能。


第一性原理:LLM 只有一个能力

从 2023 年火到现在,LLM 的核心能力其实只有一个:

预测输出。

你给它输入,它预测下一个 token,然后下一个,再下一个……直到输出完成。

就这么简单。

其他你听过的能力——什么 tools、function calling、联网搜索——本质上都是在这个能力上包了一层皮

LLM 就是一个超级强大的"续写机器",所有花里胡哨的功能,底层都是让它"续写"出特定格式的内容。


Function Calling 的真相

既然说到 tools/function calling,有必要讲清楚。

这个功能其实就是一段提示词,大概长这样:

我有下面三个 tools: 

- tool1: 功能1,参数1、参数2 

- tool2: 功能2,参数1、参数2 

- tool3: 功能3,参数1、参数2

当你解答问题 X 时,先检查 tools,看看哪个能解决。如果是 tool1,就返回 tool1(参数1, 参数2) 这种格式。

实际还会复杂一些(tool id、多轮调用等),但本质就这样。

就是一段提示词,让模型按固定格式输出。

你看,LLM 开发商把常用能力包装成了 tools/function calling。叫什么名字随他们,你也拦不住。


Agent 是什么?

有了上面的认知,我们来看 Agent。

LLM 开发商写了一个应用,这个应用调用"预测输出 + tools"的能力。可以是网页版,也可以是 Claude Code 这种 CLI 工具(终端,或称命令行)。

这个应用叫Agent

Agent 这个词,准确翻译是"代理人、经纪人、媒介"。虽然现在大家喜欢叫"智能体",但"代理"更贴切。

代理什么呢?

代理你和 LLM 的交互周期。

原来,你需要:

prompt1 → 等 response1
根据 response1 补充 → prompt2 → 等 response2
根据 response2 补充 → prompt3 → 等 response3
……
直到第 5 轮,终于得到想要的结果 response5

而 Agent 让你只输入:

prompt1,中间全自动,直接拿到最终 response5。

Agent = 自动化循环 prompt 的人机中介。

到这里你已经理解了 70%。


Agent Skills 的真相

现在你应该能猜到了。

Agent Skills = 把那些固化的流程、功能、注意事项,记录下来,打包成"技能包",方便以后复用。

就是这么简单。

你说不对,有些 Skill 能自动剪辑视频呢!怎么可能这么简单?

真是这么简单。

因为 LLM 知道怎么用某个 Python 库剪辑视频。它通过和 Agent 多次交互,在你本地部署这些库,编写脚本代码,然后执行。

整个过程你不会写代码、看不懂代码,但它就这样干了。

其他神奇的 Skill 也是如此。你觉得神奇,是因为你不知道网络上有现成工具能实现——而 LLM 知道。


实际怎么用?

举个例子。

我经常要评审公司的项目 SOW(.docx 文件),就跟 Agent 说:

帮我从项目计划、预算、验收和风险 4 个方面评审这个 SOW。

Agent 勤劳地做完了,效果可能还差点意思。毕竟它对我们公司理解有些,我给它的第一轮提示词也不完善。

于是,我继续补充:注意检查有没有日期、计划太紧张不合理的要提示出来。

Agent又勤劳的工作,直到我满意它的输出。

这时我说:把刚刚的过程提炼成 Skill。

然后它就生成对应格式的 Skill 文件。如果 Agent 不太"聪明",你就手动复制到指定文件夹。

下次再评审时,不用给重复的 prompt,你只要说评审这个SOW即可

你看,你完全不知道 .docx 文件是怎么被打开和解析的,你只要结果。过程保存为 Skill,下次直接用。

本质上就是这么简单。


最后

Agent Skills 没有魔法。

它就是:提示词 + 固化流程 + 自动化调用。

揭开神秘面纱之后,你就能从"伸手党"变成"创造者"——自己根据需求,定制专属 Skill。

2026-01-21_23-50-11

如果这篇文章让你"恍然大悟",点个在看让更多人看到。

你准备用 Skill 解决什么问题?评论区告诉我,说不定我能帮你设计一个。


这是「揭开 Claude Code 的神秘面纱」系列的第二篇。

53AI,企业落地大模型首选服务商

产品:场景落地咨询+大模型应用平台+行业解决方案

承诺:免费POC验证,效果达标后再合作。零风险落地应用大模型,已交付160+中大型企业

联系我们

售前咨询
186 6662 7370
预约演示
185 8882 0121

微信扫码

添加专属顾问

回到顶部

加载中...

扫码咨询