微信扫码
添加专属顾问
如何让AI Agent的技能更高效、更经济?Perplexity团队揭示,每个技能都像一笔持续支付的“税”,从索引到运行层层叠加成本。 核心内容: 1. 技能作为“税”的三层成本结构 2. 索引层对模型注意力和路由准确度的消耗 3. 技能设计对任务执行效率的关键影响
原文作者:Perplexity Research
原文标题:Designing, Refining, and Maintaining Agent Skills at Perplexity
原文链接:https://research.perplexity.ai/articles/designing-refining-and-maintaining-agent-skills-at-perplexity
你写了个 Skill 放进 Agent。
你觉得是在帮它长本事。
但实际上,你刚刚向每一个用户、每一次会话,加了一笔长期都要付的税。
这个结论来自 Perplexity 团队。
他们的 Computer 系统在生产环境里维护着大量 Skill——从通用工具,到金融、法律、健康这些垂直领域能力,每个 Skill 都需要经过评测、真实查询和失败案例反复打磨。
为什么说 Skill 是税?
答案藏在它的加载机制里。
一次 Skill 加载拆成了三层。
每一层,都是一道税。
第一层,索引。
Agent 会话开始时,系统会把所有 Skill 的 name 和 description 放进上下文。
一个 Skill 约 100 个 token。
几十上百个 Skill 一叠加,每个用户、每个会话还什么都没干,就已经先付了几千甚至上万 token。
这有点像人头税——不管用不用,先交了。
而且上下文是一张很贵的工作台。
你放上去的每样东西,都在挤占别的东西的位置。
description 写太宽,模型容易误触发。
写太窄,模型又可能错过调用。
每多一个 Skill,就多一个路由分叉。
索引层贵的不仅仅是 token,还有模型注意力和路由准确度。
第二层,加载。
模型判断某个 Skill 用得上,就会把整个 body 拉进上下文。
理想情况下,body 不超过 5000 个 token。
这时候 Skill 正式进入 Agent 的工作记忆。
接下来做计划、执行、判断、修正,都会受它影响。
人类看文档,可以扫过去、跳过去。
模型不行。
只要内容进了上下文,它就会把每一个字当信号来处理。
一个 Skill 写太长了、写太泛了、写得像说明书——它不是在旁边安静待着,它会污染整个任务空间。
模型可能带着错误的重点往下走,挤掉真正有用的信息,也让其他 Skill 更难被正确调用。
第三层,运行时。
长篇参考文档、模板、脚本、特殊案例——这些可能有用,但每次都直接加载太贵了。
所以更适合放在附件里,等模型真正需要读取时再付成本。
三层合在一起——索引、body、附件——越早进上下文,税率越高。
索引最贵,所有会话都要看。
body 次之,加载后会跟着任务走一段时间,直到上下文压缩或任务边界出现。
附件最便宜,用到才读。
这也解释了为什么给模型更多资料,不一定会让它更强。
Perplexity 的税务 Skill,早期把 1945 个税法章节全塞进一个文件,结果比不加载还差。
后来重构成三层嵌套——先定位大的领域,再进入更细的主题——还配了快速参考指南,帮模型更快定位。
效果反过来:
模型做税务任务的表现,超过了只用通用工具。
模型需要的不是一座资料山。它需要的是一条在正确时刻找到正确资料的路径。
三层税讲完了。
既然是税,下一个问题就是:
什么样的 Skill 值得交这笔钱?
本质上,这是上下文经济学——你写的每一行字,都在向所有用户、所有会话收取成本。
值不值?全看这一行字能不能帮模型做一个它自己做不好的判断。
四种情况值得写。
第一,模型缺了这段上下文就会稳定做错,如公司内部流程、产品专用规范、业务特有标准。
第二,需要跨任务保持高度一致,如品牌语气、输出格式、审核红线。
第三,包含组织自己的判断和品味。
Perplexity 的设计负责人 Henry Modisett 写过几个设计相关 Skill,里面会指定用什么字体、避免什么字体,以及这些选择带来的感受。
审美和偏好,模型可以有通用能力,但不一定有你的标准。
第四,模型反复踩坑的地方。
Perplexity 管这叫 gotchas——提醒模型这里有坑、这个场景别这么做、这个条件下换一种处理方式。
这些失败边界,往往是整个 Skill 里最有价值的内容。
到了这一步,Perplexity 给出了最核心的建议。
你写 Skill 的每一行字,都得先过这关:
“如果没有这条指令,Agent 会犯错吗?”
通不过,删掉。
不管写得多好。
Pascal 在 1657 年说过:
我之所以把这封信写得更长,只是因为没有时间把它写得更短。
写一个短的 Skill,远远难过写一个长的。
那反过来,什么不值得写成 Skill?
模型本来就会的东西。
Git 命令、通用写作技巧——这可能是好文档,但往往是烂 Skill。
模型在训练数据里大概率已经见过很多遍了,再写一遍就是噪音。
一句系统提示词就能稳定解决的事,也不需要 Skill。
变化比维护还快的东西,也不适合写进 Skill。
比如频繁变动的 MCP 端点。
Skill 一过期,就会从知识变成误导。
Agent 带着旧地图走新地形,根源就是上下文漂移。
三个问题帮你判断:
这是模型稳定缺失的能力吗?
长期有效吗?
值得每次加载都付成本吗?
前面讲的这些规则——索引按人头收税、加载不能有废话、只写模型不知道的、不写它本来就会的——你发现没有,每一条都在跟你写代码的直觉对着干。
Perplexity 发现,Python 之禅那几句金科玉律,到了 Skill 这里,全翻了过来。
一共五条。
第一条,简单胜过复杂。
写代码的时候,逻辑越平越好,一个文件能搞定,就别建目录。
但 Skill 正好相反——复杂度本身就是功能。
因为不同内容税率不一样。
你把所有东西平铺在一个文件里,模型就不知道什么重要、什么按需看。
前面那个税务例子——1,945 个 section 平铺在一个结构里,比不加载还差——就是在说这件事。
结构就是功能。
第二条,显式胜过隐式。
代码里,一切调用都得写清楚,不写就不会执行。
但 Skill 的激活,靠的是隐式模式匹配。
模型自己根据语义判断该不该加载,不是你在代码里写死一个 if。
所以 description 才那么难写——它不是功能说明,是路由触发器。
差一个词,模型可能就误判了。
第三条,稀疏胜过稠密。
Python 这句话的意思,是写代码别挤在一起——多分行、多留白、逻辑拆开,用空间换可读性。跟字数多少没关系。
但在 Skill 里,你没有这个本钱。
索引层 100 个 token 一个 Skill,body 层 5000 个 token 一加载就占住上下文。
多一句废话,就多交一份税。
你必须反过来——把每个 token 的信息密度压到极致,一行废话的空间都不能给。
第四条,特殊情况不足以打破规则。
写代码的时候,特殊情况就当特殊情况处理,别把主逻辑搞复杂。
但 Perplexity 说,gotchas——那些“这里有个坑”“这个场景别这么干”——恰好是整个 Skill 里价值最高的内容之一。
模型最容易在这些边界上翻车。
你把这些写清楚,比写一堆正向流程更管用。
第五条,好实现应该容易解释。
如果你写的东西三两句话就能说清楚,模型可能早就知道了。
删掉。
Skill 该写的,是模型没有这段上下文就会犯错的地方。常识不用写。
五条反转,指向同一件事:
代码写给运行时,精确调用的成本很低。
Skill 写给模型,注意力才是最贵的资源。
Perplexity 把 Skill 叫税,不是说少写 Skill。
正好相反——正因为设计成本高,才说明它重要。
一个差的 Skill 是上下文债务,重复常识、污染注意、制造误触发。
一个好的 Skill 是压缩资产——让 Agent 在正确时间看到正确信息,把团队的判断、边界和经验变成可复用的结构。
Agent 系统的竞争,正在从谁接了更多工具,进入下一个阶段:
谁更懂得管理上下文。
这篇文章讲了为什么 Skill 是一种税。
一条 Skill 怎么设计、怎么压缩、怎么评估、怎么维护。
53AI,企业落地大模型首选服务商
产品:场景落地咨询+大模型应用平台+行业解决方案
承诺:免费POC验证,效果达标后再合作。零风险落地应用大模型,已交付160+中大型企业
2026-07-01
我们做了一款招投标Skill,数据按需调用
2026-07-01
Harness 工程之道:Skill 原理与最佳实践
2026-07-01
SkillOpt 架构拆解:把 Skill 文本当参数,用执行轨迹训练 Agent
2026-07-01
重新思考研发基础设施:当 Agent 成为第一公民
2026-06-30
一个测试人必备的需求分析Skill,搞定需求分析8大维度,生成用例采纳率直接拉满
2026-06-30
开源「仓颉.Skill」2.0,你现在可以蒸馏任何视频!
2026-06-30
手写 Skill vs skill-creator:差距在哪
2026-06-30
写 Skill 不是写 Prompt,而是给 AI 搭一条生产线
2026-05-15
2026-04-05
2026-05-24
2026-04-16
2026-04-09
2026-04-14
2026-05-06
2026-05-19
2026-05-20
2026-05-03
2026-06-28
2026-06-23
2026-06-11
2026-06-11
2026-06-09
2026-06-08
2026-05-28
2026-05-19
欢迎您使用【53AI 官方网站】(以下简称“本网站”或“我们”)。本《会员服务协议》(以下简称“本协议”)是您(以下简称“会员”或“用户”)与【深圳市博思协创网络科技有限公司】之间关于注册、登录及使用本网站会员服务所订立的法律协议。
在您注册或登录前,请务必审慎阅读、充分理解各条款内容,特别是免除或限制责任的条款、知识产权条款、争议解决条款等。此类条款将以加粗形式提示您注意。 当您通过微信公众号授权、手机验证码验证或其他方式成功登录本网站时,即视为您已完全理解并同意接受本协议的全部内容。
一、 定义
本网站:指由【深圳市博思协创网络科技有限公司】运营的,域名为【53ai.com】的网站及相关移动端页面。
会员服务:指本网站向注册会员提供的知识库文章查阅、内容检索及其他相关增值服务。
知识库内容:指本网站发布的包括但不限于文字、图表、数据、研究报告、行业分析等数字化内容资源。
二、 账号注册与登录
登录方式:本网站支持以下登录方式,您可根据实际情况选择:
微信公众号授权登录:您同意将您的微信OpenID信息授权给本网站,用于创建或关联会员账号。
手机验证码登录:您需提供真实有效的手机号码,并通过短信验证码完成身份验证与登录/注册。
账号安全:您的账号仅限您本人使用,禁止赠与、借用、租用、转让或售卖。因您保管不善导致的账号被盗、密码泄露等损失,由您自行承担。
实名认证:根据相关法律法规要求,我们可能要求您在特定功能下完成实名认证。如您拒绝提供,可能无法使用部分或全部服务。
未成年人保护:若您未满18周岁,请在法定监护人的陪同下阅读本协议,并在征得监护人同意后使用本服务。
三、 服务内容与规范
知识库查阅权限:会员登录后,有权按照其会员等级对应的权限范围,在线浏览、检索本网站知识库中的相关文章及内容。
服务变更:我们有权根据业务发展需要,调整、变更或终止部分服务内容,并将以网站公告、公众号消息等方式提前通知。
禁止行为:您在使用服务时不得实施以下行为:
利用技术手段批量爬取、下载、转存知识库内容;
将知识库内容用于商业目的或未经授权地向第三方传播;
干扰本网站正常运行或侵犯其他用户合法权益;
发布违法违规信息或从事违反公序良俗的活动。
四、 知识产权声明
权利归属:本网站知识库中的排版设计、软件代码等内容的知识产权均归【公司全称】或原权利人所有,受《中华人民共和国著作权法》等法律保护。
有限许可:本网站授予会员一项非独占、不可转让、不可转授权的普通许可,仅限于个人学习、研究之目的在线查阅知识库内容。
侵权追责:未经书面许可,任何单位或个人不得以任何形式复制、转载、摘编、镜像、汇编或以其他方式使用上述内容。一经发现,我们保留追究其法律责任的权利。
五、 个人信息保护
我们重视对您个人信息的保护。关于我们如何收集、使用、存储和保护您的个人信息,请单独阅读 《隐私政策》。
您通过微信公众号授权或手机号验证所提供的信息,我们将严格按照《个人信息保护法》的规定处理,仅用于身份识别、服务提供及安全验证等必要用途。
您可以随时通过网站设置或联系客服行使查阅、更正、删除个人信息及撤回授权同意的权利。
六、 免责声明
内容准确性:知识库内容仅供参考,不构成专业建议。我们不对其完整性、准确性、时效性作任何明示或暗示的保证,您应自行判断并承担使用风险。
不可抗力:因自然灾害、政策法规变化、网络故障、第三方平台接口异常(如微信接口维护、运营商短信通道故障)等不可抗力导致的服务中断或延迟,我们不承担违约责任。
第三方链接:本网站可能包含指向第三方网站的链接,该等网站的内容和服务不受我们控制,请您自行甄别风险。
七、 违约责任
如您违反本协议约定,我们有权视情节采取警告、限制功能、暂停服务、注销账号等措施,并保留要求赔偿损失的权利。
如因您的违约行为导致我们遭受行政处罚、第三方索赔或商誉损失,您应承担全部赔偿责任(包括但不限于罚款、赔偿金、律师费、公证费等)。
八、 法律适用与争议解决
本协议的订立、执行和解释均适用中华人民共和国大陆地区法律。
因本协议产生的或与本协议有关的任何争议,双方应友好协商解决;协商不成的,任何一方均可向【公司所在地】有管辖权的人民法院提起诉讼。
九、 其他
本协议构成双方就本服务达成的完整协议,取代此前任何口头或书面约定。
本协议任一条款被认定为无效或不可执行的,不影响其他条款的效力。
我们对本协议享有最终解释权,并在法律允许的范围内保留随时修改的权利。修改后的协议一经公布即生效,继续使用服务即视为同意修订内容。