我要投稿

Skill越详细Agent越傻！砍到40词一次选对

发布日期：2026-05-27 09:49:33 浏览次数： 1563

作者：李举刚

微信搜一搜，关注“李举刚”

很多人在给Agent写Skill描述时，默认一个前提。写得越详细，Agent越容易理解。

这套思路在人类协作里没问题，可一旦换成模型，情况完全反过来。

很多Agent选错技能、反复调用、token越烧越多，其实都卡在同一个地方。Skill写太长。

一个开发者分享过一个很典型的例子。

他给某个Skill写了90词描述，逻辑很完整，像一段小说明书。结果Agent老是选错技能。

后来他干脆把描述砍到40词以内，只保留最核心的动作词。

结果第一次调用就选对了。

很多人看到这个案例的第一反应是惊讶。

但如果你真的做过Agent系统，很快会意识到，这事一点不奇怪。

1

很多Agent开发者把Skill.md当文档写。

问题就从这里开始。

Skill描述一旦写长，就会同时触发三件事。

token成本增加、选择噪声增加、注意力被稀释。

先说最现实的一件事，钱。

Skill描述本身就在上下文里。

多写一句话，Agent每次运行就多读一次，多算一次token。

只要这个Skill被频繁加载，你就在持续付费。

再看上下文预算。

GPT-5.5默认上下文窗口是272k token。

听起来很多，对吧。

但真正分配给技能描述的预算只有2%。

注意，是所有Skill一起分这2%。

如果你的系统有几十个Skill，很容易就把预算挤满。

一旦超过限制，模型会截断技能描述。

很多人以为自己写得很清楚。

模型看到的版本其实已经被截断。

第三个问题更隐蔽。

选择噪声。

Agent在决定调用哪个Skill时，会同时扫描所有Skill描述。

描述越长，信息越杂，判断信号就越模糊。

你写了一堆解释性文字。

模型只需要几个动作词。

结果就是。

真正关键的信息被淹没。

Codex内部的计费逻辑也很直接。

严格按UTF8字节数除以4向上取整计算token。

写长一句话，看起来没什么。

运行几万次之后，就是一笔真实的成本。

所以很多团队后来才意识到。

Skill描述越长，系统越慢，钱烧得越快。

2

我印象里有个挺典型的案例。

一个做Agent开发的大厂P7工程师，技术方向是自动化运维。他在内部做工具链，把十几个运维操作封装成Skill。

每个Skill的描述都写得很认真。

几十到一百词不等。

上线以后问题马上出现。

Agent经常调用错技能。

比如需要deploy的时候，跑去执行inspect。

需要verify时，又去调用release。

团队开始怀疑模型能力。

后来他们做了一件很简单的事。

把Skill描述全部压缩。

平均长度从接近90词降到40词以内。

保留动作词，删掉解释句。

deploy

release

verify

debug

inspect

fix

上线测试之后，调用准确率直接明显提升。

那位工程师后来复盘时说了一句挺有意思的话。

模型其实不需要说明书，它只需要路标。

说实话，这种情况挺常见的。

这事跟你写代码水平没太大关系，很多工程师第一次做Agent都会踩这个坑。

因为人类写文档的习惯，很难一下子改过来。

3

有个做法在Agent圈子里越来越多人用。

Peter的skill-cleaner就是典型例子。

Peter也叫steipete，很多人认识他的原因是那套agent-scripts工具。

他在设计skill-cleaner时做了一个很极端的选择。

Skill.md只有56行提示词。

真正干活的脚本接近近千行代码。

提示词只干一件事。

让Agent找到这个能力。

具体逻辑、异常处理、边界情况，全写在代码里。

Peter自己总结这套方法时说得很直白。

install skill

agent smart

user happy

很多人第一次看到这种写法会觉得太简单。

但实际跑起来反而很稳定。

原因很简单。

Skill描述只承担定位功能。

真正的执行逻辑在脚本。

skill-cleaner的设计思路也围绕这一点展开。

它会先扫描你的技能库，然后做一轮完整体检。

第一个模块是技能提示词预算审计。

脚本会计算所有Skill描述占用多少上下文预算，并给出优化建议。

第二个模块是重复技能检测。

它会同时扫描几个来源。

Codex内置库

插件缓存

代码仓库

个人技能根目录

如果出现重复Skill，会标出来。

第三个模块是未使用技能筛查。

脚本会读取历史日志，找出长期没被调用的Skill。

第四个模块是技能根目录审计。

系统会统计每个Skill来自哪个目录，同时标记启用或禁用状态。

第五个模块是描述精简优化。

脚本会找出冗长描述，然后用短动作词进行替换。

比如调试类Skill。

推荐统一动作词。

debug

inspect

fix

部署类操作。

deploy

release

verify

检索类操作。

sync

summarize

这些词非常短。

但模型识别效率反而更高。

整个脚本内部使用的预算计算逻辑，和Codex官方源码一致。

也就是UTF8字节数除以4向上取整。

脚本还能模拟真实运行环境。

如果预算不足，会直接告诉你。

多少字符被截断

多少技能会被省略

以及当前预算使用率、剩余预算、上下文占用比例。

很多团队跑完第一次报告都会吓一跳。

原来Skill描述已经把上下文预算吃掉一大块。

4

如果你现在在做Agent系统，其实可以立刻给自己的Skill做一次体检。

skill-cleaner就在GitHub上。

地址是 github.com/steipete/agent-scripts/tree/main/skills/skill-cleaner

整个流程很简单。

第一步。

在技能目录或者仓库根目录运行Node.js脚本。

脚本支持很多参数，比如时间范围、日志深度、预算阈值、技能根目录路径。

第二步。

看报告。

一般建议按这个顺序看。

技能预算

描述优化项

重复技能

未使用技能

根目录汇总

第三步。

再做清理。

有几个经验比较重要。

Codex内置技能尽量保留。

本地副本如果重复，可以删掉。

仓库里核心运维Skill建议留着。

它们通常和项目环境绑定。

还有一点很多人会忽略。

不要直接删目录。

先确认这个Skill确实没有被任何脚本调用。

描述精简也有个简单流程。

先做文本预处理。

统一格式，全部小写，去掉多余标点。

再用关键词识别场景。

判断是调试、部署还是检索。

最后替换成标准短动作词。

这样一轮下来，大多数Skill描述都能明显变短。

很多人做完这一步都会发现一个问题。

之前写的那些长描述，几乎没有提高任何效果。

只是让上下文更拥挤。

5

如果你现在正在维护一套Agent系统，可以先做三件事。

1 把所有Skill描述统计一遍长度。

超过40词的先标出来。很多问题就在这些地方。

2 跑一遍skill-cleaner。

重点看技能预算占比和未使用技能报告。

3 把描述里的解释句删掉，只留下动作词。

debug、deploy、search这类词往往就够了。

别慌。

Agent开发的很多坑，其实都在这些细节里。

Skill写短一点。

系统反而更聪明。

53AI，企业落地大模型首选服务商

产品：场景落地咨询+大模型应用平台+行业解决方案

承诺：免费POC验证，效果达标后再合作。零风险落地应用大模型，已交付160+中大型企业

相关资讯

2026-05-28

大模型的Agent Skill功能，在LLM HTTP底层交互流中是怎么承载的？

2026-05-27

1.1万字 Codex保姆级教程：小白从安装到跑通项目

2026-05-27

verify-data：一个端到端的数据验数 Agent Skill

2026-05-26

lark-cli：企业 SaaS 走向 AI 化时，值得对照的一份范本

2026-05-25

SkillRouter：从 8 万技能里找对那一个，这套方案只要 1.2B 参数

2026-05-25

让 Codex 设计前端不丑：Skill、参考站点与重开发流程

2026-05-25

Claude Code 这16个官方Skill，用了半年我总结出最值得装的7个

2026-05-25

最强Hermes Agent使用指南

联系获取

160+中大型企业正在使用53AI

立即咨询预约演示

把握AI发展的机遇，共同探索、共同进步

2025-01-22

如何打造基于GenAI的员工服务机器人

2025-01-22

热点资讯

开源「女娲.skill」，你现在可以去蒸馏任何人！

2026-04-05

OpenAI Codex Skills 深度技术解读

2026-03-05

视频分镜提示词Skill，详细制作过程分享！

2026-03-17

OpenCode进阶指南：MCP协议与Skill技能，让你的AI助手真正"开外挂"

2026-03-04

Agent Skills：把提示词升级成“员工手册”，让 Agent 真正可复用、可规模化

2026-03-03

Skills 真的可以帮我干活了：把工单分析变成一个可复用的 Skill

2026-03-03

当AI自己学会搭积木：Skills的崛起，会杀死Dify吗？

2026-03-17

🦞元宝派「养虾」常见问题答疑

2026-03-26

OpenClaw 搭团队太折腾？这个 Skill 一键搞定多智能体协作

2026-03-10

让你的 ClaudeCode 秒变 Openclaw（龙虾），连接飞书、Discord 远程控制

2026-03-05

大家都在问

大模型的Agent Skill功能，在LLM HTTP底层交互流中是怎么承载的？

2026-05-28

当我们在管 Skill 时，我们到底在管什么？

2026-05-19

怎么创建一个真正能干活的 Skills？

2026-05-09

Skill 是怎么悄悄变成 SOP 的?

2026-05-08

如何从0到1创建一个画原型的Skills？

2026-04-29

如何把经验装到Skills？

2026-04-29

你写的 Skill，及格了吗？

2026-04-22

万字干货！Harness Engineering如何工程化落地？

2026-04-22

热门标签

内容创作大模型技术个人提效 langchain llamaindex 多模态技术 RAG技术智能客服知识图谱模型微调 RAGFlow coze Dify Fastgpt Bisheng Qanything AI+汽车 AI+金融 AI+工业 AI+培训 AI+SaaS Skill 提示词技巧 AI+电商 AI面试数字员工 ChatBI AI知识库开源大模型智能营销智能硬件 FDE AI+医疗 MaxKB Palantir Glean Openclaw