我要投稿

Anthropic 指路，Letta 破局：Agent 下半场的关键词是 Skills

发布日期：2025-12-19 06:34:08 浏览次数： 1746

作者：硅基生命AIGC

微信搜一搜，关注“硅基生命AIGC”

今年，关于 AI Agent 我们最能直观感受到的一个变化就是它已经在真正开始落地了。在内容团队的自动化生产链路中，企业内部的数据归档、自动报告、系统对接，或者是在一些小型业务流程的 7*24 小时自动运维，你都能看到它的身影。

可是，我们在 Demo 中看到的可以推理几十步、自动拆解任务、跨系统执行的 Agent，到了真实业务场景，就变成了另一副样子？上一分钟还好好的，下一分钟就开始瞎跳步骤。它很聪明，但不可靠；它很有想法，但不一致。

关于 Skills

目前大部分团队都在存在同一个问题：模型很强，但 Agent 还是像个临时工？

当你把 Anthropic、Letta、以及最近一批关于 Agent Skill 方向的技术文章放在一起看，就会得到一个很清晰的答案：过去构建的 Agent，本质上只有大脑，没有技能。它能执行一次性的任务，但不会把这次的经验变成 SOP，留给下次复用。

Agent 有了技能，才能像一个有多年经验的老员工，知道这里为什么这么做、下一步该怎么接、遇到坑要怎么绕过去。

如果把技能这个词放到更大一点的视角里看，可以说它是让 Agent 能够靠近现实世界的关键结构。因为现实世界有边界、有隐性规则、有稳定的流程、有可重复的 SOP、有一些你不能乱改、不能跳过、不能随便 guess 的步骤。

关于 Agent Skills

Anthropic 把技能定义成一种可插拔的能力包，有点像一个微型的插件系统。一个技能，其实就是一个目录，里面放着一个描述技能的意图、能力边界、输入输出、使用场景的 SKILL.md 以及一些脚本、资源、模板。

为什么说是一个目录？因为模型在启动时只需要读取最小量的 metadata，直到真正需要这个技能，才会按需加载内容。这个机制可以解决两个难题：

一、技能不会把上下文撑爆，你可以挂一堆技能，但模型不会被迫把它们全部吃进去；

二、技能可以保持稳定性，你不需要模型每次都理解你的 prompt，你让它直接执行脚本就行了。

模型决定怎么想，技能决定怎么做。这听起来简单，但它是 Agent 走向生产级稳定性的前提。

关于 Skill Learning

Anthropic 推出的 Skills，其实就像是给 Agent 配一套随身的小手册，里面写着怎么处理特定类型的任务，Agent 不用每次都从头推理。

但这类 Skill 更像 SOP，是静态的。Letta 的工作从这里往前跨了一步，既然有了静态手册，为什么不让 Agent 在踩过坑之后，把那些经验萃取出来，再成长为新的技能？Agent 执行任务→生成轨迹→反思→总结→压缩→产出新的技能文件。这样，原本只会查 SOP 的 Agent，就开始具备了写 SOP 的能力。