微信扫码
添加专属顾问
我要投稿
探索AI智能体的未来:Skills技术如何让智能体像人类一样"自学成才"。核心内容: 1. Skills技术的核心构成与运作机制 2. 通过人力资源案例类比理解Skills的革新意义 3. 智能体如何通过Skills实现自主决策与任务执行
朋友们好啊!我最近在研究claude-code,并且对智能体有了更新的认识。claude-code是一款编程工具,但是本质上它是一个AI智能体,可以完成包括编程在内的其他任务,因为它可以根据任务的进度,实时的对当前所发生的事情进行思考,并自行作出决策,因此,如果交给它的任务是类似规划旅游路线、处理税务等,理论上只要工具充足,它都能完成这这些任务。不过,今天,我将详细讨论一下它里面的skills这个可能颠覆下一代智能体的新技术。
从现实角度讲,在claude-code中,skills就是一堆文件夹,每一个文件夹里面包含了一些固定的文件,
网上有很多文章,专门去讲如何使用它,这里就不过多展开,我们主要聊一聊它内在的一些变革意义。虽然从技术上,Skills是比较简单的,但是,当我们更深入地去思考,就会发现,在概念上Skills所带来的价值非常大。从概念上,我们可以重新去解释Skills,让读到这篇文章的朋友们可以更彻底地理解什么是Skills。
让我们更理解Skill的概念
我们用人来类比,Skills特指我们在简历中“特长”一栏所填写的内容,一个skill就是claude-code的一个特长。当公司需要有人去接待外国客户时,老板会从简历中去找“特长”一栏填了“特长英语,雅思8.0,口语流利”的人出来。随后,人事总监召集了这些人,开始对他们能否通过英语来表达公司产品的优势、公司企业文化等等进行了深度评测,而这些人只有很少一部分能以非常专业的术语,来契合公司生产的实际场景。最后,终于挑出了一个人,成为这次任务的实施者,并最终完成了任务。而正是这次完成任务的经验,让公司在下次需要接待外国客户时,仍然找他。
当claude-code发布Skills功能之后,用户就可以为它定制特长技能。当新的技能被安装好后,用户可以在提示词中指出,使用xx这个技能为我做xx事,claude-code就会去加载这个技能,当然,即使不在提示词中明确指出,claude-code也会根据用户的意图去判断是否要使用某些技能。
一旦技能被触发,claude-code就不再通过大模型生成的方式去执行任务过程中的某些具体处理点,而是通过大模型生成调用skill中的脚本来完成任务。
Skills是一个全新的创新,在以往是没有出现过类似技术的。虽然它的原理是可以被轻松理解的,但是在此之前,从来没有人这么去做过,而这次claude-code做了一个非常有意义的功能。
和工具调用有什么不同?
最早,我们通过Function Call模式来实现大模型工具调用,简单讲就是让大模型返回一个用来做工具调用的固定JSON格式(包含函数名和参数),本地程序拿到这个JSON后,按照固定规则去调用本地的一个函数,执行完本地函数拿到结果后,将结果交给大模型,让大模型进行下一步处理。后来,MCP成为工具调用的主要方式,它在Function Call的基础上,增加了更丰富的协议层,并且涌现了一大批第三方的MCP服务。但是,随着Agent链接的MCP服务越来越多,问题也越来越麻烦,因为MCP需要提供丰富的指令信息,而且每次请求都会携带,这就使得token消耗的很快,大模型性能受到影响。虽然通过技术手段,可以对单次请求对MCP做遴选,但是所消耗的时间成本也很大。
而Skills的出现,既能满足工具调用的需求(甚至在skill内部调用MCP也是可以的),同时它的token消耗又比较少(据称是单个100词左右),而且claude-code客户端自带了遴选逻辑,因此还非常省token,也就是实实在在的省钱。而且,和MCP类工具调用不同,Skills中的脚本专注度非常高,一个skill就为解决一件事,因此,只要用上这个skill,那么这个skill就能帮你非常精准的解决它所面对的问题,这对整个agent的执行效果来说,也是极大的提升。这比以前工具调用来说,提升的非常巨大。
和RAG之类的知识库有什么不同?
Skills还可以和RAG之类的知识库进行PK,它虽然是技术工具,但是它在某种程度上,知识比RAG更加准确。之所以会出现这个情况,是因为skill本身就是对解决某些问题(特别是非常小的精细化的问题)的技能浓缩,你可以理解为“所谓技能,就是在某个问题点上,专门的优秀解决之道”。因此,实际上,有了skills之后,解决小问题就像有了手术刀,快准狠,没有废话,毫不拖泥带水。这样一来,在某些知识问题面前,skills比知识库有着更精准的性能和更快的效率。不过,知识库的优势在于可以巨量地管理,而skills只能面对具体问题,无法做到知识库覆盖面那么广,而且skills专注于解决问题,只是附带提供解决问题的背景材料才和知识库走上了PK道路。
“经验”代码化
Skills会有“经验”的能力,它会记录每一次执行某个skill后得到的结果,将“这样执行会得到什么”作为它记忆的一部分,在后续的任务中,可以基于这些“经验”,快速解决一些场景问题。简单讲,skill程序会把运行过程的表现,总结之后,更新到自己的文档中,这样就相当于有了非常多的example,就像医生看病有很多自己的病例、棋手下棋有很多自己的棋谱,skill把自己解决过的问题总结到自己的文档中,形成了丰富的“经验”,在下一次遇到非常类似的问题时,它可以减少思考,直接从这些案例中取出脚本,可能会稍微调整一下,有的甚至都不用调整,直接传不同参数,就可以得到想要的结果。不要忘了,skill针对的是特定问题,而这类问题有非常明显的“领域特征”。这让一个skill转身变成一个领域专家。
如果后续社区发展,有人做了一个能力,通过点对点网络(类似区块链)来共享skill经验,那么,相当于所有使用了这个skill包的用户,都拥有了以前使用过这个skill的其他用户的经验,这是非常有想象空间的一件事。未来,可能针对某个非常小的领域,(我最近学会了一个词,叫“利基”)就形成了人类独有的经验套件,而且,由于这份经验是代码化的,通过点对点网络来传播,那么,相当于人类完全拥有了针对这个利基领域的绝对经验。这让我想到了《三体》中,三体人思想透明的想法,很有意思。
以前,编程是确定性很强的一项工作,1是1,2是2,代码绝对不可以含糊。但是到了AI时代,代码变得很不确定,它像是一个黑盒,你不知道代码内部做了什么,你只关注AI帮你写了实现你需求的代码。这种不确定性让很多编程行业的人瞬间发慌,赶觉这事要完💊……而Skills则是将这种不确定性重新拉了回来,为AI编程的未来,奠定了新的基础。
AI编程本质上还是要依靠大模型的预训练,才能在代码领域有所作为,agent只是可以从研发流程的角度,让编程过程更能贴近真实的开发来提升其准度,然而,如果大模型不行,再好的agent也无济于事。这也是为什么虽然claude-code可以通过修改配置来使用国内的大模型,但是,最终的编程效果却差得不是一星半点,而是十万八千。因此,对大模型的超强依赖,降低了AI编程的可控性,无论是代码的质量,还是基于大模型做决策的编程过程,都存在很大的不确定性,这也是为什么很多同行抱怨国内某些AI代码编辑器无端删代码。
而通过Skills,在同水平的大模型作为基座的前提不变下,可以提升编程的效果。
原理其实比较容易理解,首先,skill提供了关于特定问题的知识,由于关注点小,知识也就可以提供的更全面;其次,skill提供了前文所说的经验,也就是example,这也是大模型非常喜欢的东西;再次,skill可以通过脚本直接处理特定问题,这比之前大模型生成脚本代码,再保存到本地,再运行,常常是基于一些正则匹配或grep的方式进行代码搜索的情况,性能方面,skill可以做的更好,而且skill文件本身可以迭代,做的不好的,还可以修改。
之所以讲Skills会奠定AI编程未来的基础,是因为我看到了它在解决编程这件事上的一种创新,它的这种机制屏蔽了非常多的技术细节,把开发体验做的很好,同时,又真的能解决实际开发中的一些问题。从目前看到的一些公共skill来看,不少都获得了非常多的点赞,比如用来做设计的、Bug调优的、性能提升的等等。这些skill并不需要作者真的写出非常庞大的代码来解决问题,而是通过详细的描述问题本身和解决方案。想想当年我们需要通过babel来解决js的代际编译,其工程量如此巨大,真的是一种时代的遗憾。
最关键的是,它解决问题的机制,从底层重新定义了编程工作的内容,而且是确定性很强的工作内容。开发者从写确定性很强的编码,到无所适从的提示词工程、上下文工程,再到确定性很强的skills,这是一个螺旋式上升的范式迭代。
从最原始的工具调用到MCP再到Skills,智能体完成了第二次工具调用的进化。claude官方团队也作出了表态,他们将暂停MCP的进一步开发,因为他们看到了Skills的无限潜力。过去,我们通过传统的工具调用形式,自己写了一堆工具,让大模型去调用,抑或是通过MCP来调用工具。无论是哪一种,我们都需要提供非常丰富的上下文,通过与大模型直接交互来对工具执行结果进行深度的处理。但随着Skills的出现,工具调用的模式可能发生巨大的变化,Skills里面主要通过让大模型直接执行已有脚本,或者在已有脚本基础上进行优化后,得到新脚本来进行执行,而具体脚本做什么则是有文档来告知,至于在脚本中是去调用本地工具,还是发http请求来得到内容,大模型和agent都不需要知道,它们只负责上下文的构建和结果的输出。这意味着,传统的工具调用协议(Function Call和MCP)不需要了,或者说被脚本黑盒化了。这样,对于agent而言,只关注上下文,只对输入输出负责,注意力就更集中,在大模型性能本身不变的情况下,agent的能力得到提升。而且附带的,由于Skills的这种模式,上下文的token天然就少了很多,落地到我们这样的用户而言,就是花的钱变少了,能力还能提升。
过去很长一段时间,我们对Agent,信奉的都是“解决了工具调用问题,就解决了Agent”,然而,Skills的出现,让我们重新认识到“大道至简”,或许,我们根本不需要那么多工具,直接生成CLI脚本来运行可能就是那个最终的密码。
这一点,其实在Manus公布了自己的一些技术细节的时候,就已经弥生了趋势,我们从manus的公开技术中了解到了,manus的核心优势是走了与大多数平庸agent完全不同的技术路线,它注重工具的执行,为工具创建沙箱环境,而非当时大部分agent公司鼓吹的多agent模式。claude-code这次的Skills路线也是同样的道理,当大多数人还在构建工具体系时,他们却走向了“去工具化”的另一个方向。同样,沙箱环境再次成为不可或缺的一环。
这种技术路线不仅直接绕开了工具调用的复杂问题,而且还用更少的成本获得了更精准的输出效果。“Skills kill MCP”可能是真的,虽然在某些场景下,传统的工具调用是必须的,但是大部分情况下,通过Skills来解决Agent任务周期内的执行,是可行的。特别是现在Agent领域的垂直化趋势,大家不再追求通用Agent,而是做垂直领域的Agent,把一个领域吃透。而细分领域更有利于沉淀Skills,甚至一个skill本身就可以作为产品进行销售,因为一个优秀的经过验证的skill本身就是解决问题的方案,本身就是问题的答案。如果在某个领域,我们知道问题所在,而手里又正好有所有的钥匙,那么我们就可以构建出一个好的针对该领域的agent。并且,构建的成本和效率都会变得令人满意。
不过,目前来说,公开可用的Skills还是比较少的,有些问题虽然比较细分,但是要整理出完整的skill还是会比较麻烦,因此,目前的生态还是欠佳。
如果你是一个市场调研人员,你向Agent提出这样的需求“帮我列出宝洁公司去年的采购清单”,如果是真人,拿到这样的问题,是否会头大?这里面最麻烦的是,采购数据是对方公司的机密信息,怎么可能被我们获取呢?但是,如果现在我们想象一个场景,如果你是一名黑客,通过技术手段入侵了对方的系统,拿到了这个数据,(注意,这是违法行为,禁止这样实施)就可以得到想要的,不是吗?既然人可以通过技术手段来完成,为什么AI不可以?
这里就涉及到一个新的概念,“深度编程”。简单讲,就是为了解决一个问题,写了一个复杂程序。AI自己为了解决一个(可能很小的)问题写了一个非常复杂的应用,来完成目标任务。举个例子,为了实现对pdf的理解,AI实时编写了一个pdf解码程序(软件);为了实现地图标注,AI实时写了一个地图应用来渲染地图;为了实现某家公司当天的股价进行分析,AI自己写了一个股票数据看板应用;为了实现与用户的可视化交互,AI自己写了一个点对点实时通话应用(最近google发布了A2UI协议,和这事儿关联挺大);甚至,为了解决某些问题,Agent自己写了一个Agent来完成这个问题的解决……而更重要的一点是,解决了这个问题之后,AI大费周章折腾的这些程序、软件,直接丢弃了,不需要了。这就是AI时代的处事风格,通过实时编程(创建复杂程序)来解决一个任务中的单点问题,这种“杀鸡用牛刀”的风格,在下一代Agent中会变得非常常见。
这里的核心思想在于,人只是提出需求的一方,而AI是实现的一方,人不再关注实现过程,只关注结果。能够支撑AI完成这种广域范围的编程能力,只为解决人类一个大需求中的一个细节的,绝对不是当前的Agent工具调用技术,而是更底层更根本的机器脚本技术。而Skills明显离这种情况更近一些。现在AI的自主能力远远不及人们的预期,根本的原因是,AI还无法通过思考找到脱离模型本身的解决路径,例如AI无法通过自我发现而连接到facebook寻找人物关系作为解决获客问题的一环,也无法通过自主决策在NASA官网提交深空探索建议书作为解决研究深空温度测量的一环,AI还是按照人类设计的牢笼在工作,因此,还远远达不到人类的预期。只有当人们赋予它更原始的,接触到底层操作系统的权限的时候,它才能在自我积累后找到可能突破的路径。而Skills的这种从工具中脱离出来,大道至简,以命令行为主要实施手段的方式,正好是解放Agent的一条有利路径。
当然,这也会有些问题,如果AI可以无限制的深度编程,很有可能会出现一些事故,例如把发电厂的系统搞崩溃而导致城市断电、尝试发射导弹、为了试验深空太阳能把一头奶牛送上太空……AI不会觉得这很奇怪,因为这只是它们解决问题的一个环节而已。虽然如前文提到,我们会考虑使用沙箱来运行AI编写的程序,但是AI很可能突破这个沙箱。这会是一个巨大的挑战,如何找到解决这种矛盾的办法,未来肯定是一个值得研究的课题。
本文从claude-code的Skills功能展开,探讨了Agent设计的一些想法。对于开发者们而言,Skills可以帮助我们解决一些AI编程的不确定性问题,可以帮助我们降低AI编程中的幻觉,同时又由于其特殊的设计,可以节省成本。在Agent设计中,Skills是一个新思路,它突破了传统工具调用的局限,很可能在未来占据一席之地。对此,你有什么看法呢?可以在下方留言,让我们一起探讨。
53AI,企业落地大模型首选服务商
产品:场景落地咨询+大模型应用平台+行业解决方案
承诺:免费POC验证,效果达标后再合作。零风险落地应用大模型,已交付160+中大型企业
2025-12-22
被字节扣子的新功能戳到了。
2025-12-21
预订本年度最有价值提示词 —— 生成既有质感,又能随意修改文字的完美 PPT
2025-12-18
Just-in-Time Context,一篇就够了。
2025-12-18
这套提示词,帮你快速解锁Gemini 3 Flash前端设计能力
2025-12-17
【提示词并没有死,而是进入到深水区】重读我在PEC的提示词分享有感
2025-12-15
Prompt是与LLM对话的唯一方式:如何用结构化思维和隐形设计,重构人机交互?
2025-12-15
一款由字节跳动推出的 AI 提示词生成和优化工具,为你提供更精准,专业,可持续迭代提示词!
2025-12-14
YPrompt:AI提示词生成与管理系统
2025-11-20
2025-11-15
2025-11-15
2025-10-31
2025-11-12
2025-10-27
2025-11-15
2025-11-03
2025-12-02
2025-10-12