免费POC, 零成本试错
AI知识库

53AI知识库

学习大模型的前沿技术与行业应用场景


我要投稿

Anthropic 指路,Letta 破局:Agent 下半场的关键词是 Skills

发布日期:2025-12-19 06:34:08 浏览次数: 1538
作者:硅基生命AIGC

微信搜一搜,关注“硅基生命AIGC”

推荐语

AI Agent 正从实验室走向真实业务场景,但如何让它像老员工一样可靠?关键在于"技能"的引入与学习。

核心内容:
1. AI Agent 在落地中面临的可靠性挑战
2. Anthropic 提出的可插拔技能包解决方案
3. Letta 实现的动态技能学习与进化机制

杨芳贤
53AI创始人/腾讯云(TVP)最具价值专家
今年,关于 AI Agent 我们最能直观感受到的一个变化就是它已经在真正开始落地了。在内容团队的自动化生产链路中,企业内部的数据归档、自动报告、系统对接,或者是在一些小型业务流程的 7*24 小时自动运维,你都能看到它的身影。
可是,我们在 Demo 中看到的可以推理几十步、自动拆解任务、跨系统执行的 Agent,到了真实业务场景,就变成了另一副样子?上一分钟还好好的,下一分钟就开始瞎跳步骤。它很聪明,但不可靠;它很有想法,但不一致。
关于 Skills
目前大部分团队都在存在同一个问题:模型很强,但 Agent 还是像个临时工?
当你把 Anthropic、Letta、以及最近一批关于 Agent Skill 方向的技术文章放在一起看,就会得到一个很清晰的答案:过去构建的 Agent,本质上只有大脑,没有技能。它能执行一次性的任务,但不会把这次的经验变成 SOP,留给下次复用。
Agent 有了技能,才能像一个有多年经验的老员工,知道这里为什么这么做、下一步该怎么接、遇到坑要怎么绕过去。
如果把技能这个词放到更大一点的视角里看,可以说它是让 Agent 能够靠近现实世界的关键结构。因为现实世界有边界、有隐性规则、有稳定的流程、有可重复的 SOP、有一些你不能乱改、不能跳过、不能随便 guess 的步骤。
关于 Agent Skills
Anthropic 把技能定义成一种可插拔的能力包,有点像一个微型的插件系统。一个技能,其实就是一个目录,里面放着一个描述技能的意图、能力边界、输入输出、使用场景的 SKILL.md 以及一些脚本、资源、模板。
为什么说是一个目录?因为模型在启动时只需要读取最小量的 metadata,直到真正需要这个技能,才会按需加载内容。这个机制可以解决两个难题:
一、技能不会把上下文撑爆,你可以挂一堆技能,但模型不会被迫把它们全部吃进去;
二、技能可以保持稳定性,你不需要模型每次都理解你的 prompt,你让它直接执行脚本就行了。
模型决定怎么想,技能决定怎么做。这听起来简单,但它是 Agent 走向生产级稳定性的前提。
关于 Skill Learning
Anthropic 推出的 Skills,其实就像是给 Agent 配一套随身的小手册,里面写着怎么处理特定类型的任务,Agent 不用每次都从头推理。
但这类 Skill 更像 SOP,是静态的。Letta 的工作从这里往前跨了一步,既然有了静态手册,为什么不让 Agent 在踩过坑之后,把那些经验萃取出来,再成长为新的技能?Agent 执行任务→生成轨迹→反思→总结→压缩→产出新的技能文件。这样,原本只会查 SOP 的 Agent,就开始具备了写 SOP 的能力。
这套循环就是一个小型的自动化学习系统。Letta 在 Terminal Bench 2.0 的实验里直接给出了结果:加了 Skill Learning 的 Agent,任务成功率相较基线提升了 30% 以上,并且更稳定、更一致。
其实就是人是如何成长的那套逻辑:做得多了,你会总结。踩过坑了,你会记住。未来再遇到类似任务,你就不需要每次都再从零开始了。
这可以说是最接近Agent 自我成长的一次突破!
最后
当然,技能化也不是没有挑战。技能太多,会冲突;技能写太宽,会污染;技能学太快,会学坏;技能版本管理不做,会混乱。
现实世界的知识,本来就是动态的、概率性的、带噪声的。技能化的 Agent,只是让我们更接近可控、可维护、可演化的状态,并不是一劳永逸。
但这并不影响一个大的趋势:未来我们将训练 Agent!

53AI,企业落地大模型首选服务商

产品:场景落地咨询+大模型应用平台+行业解决方案

承诺:免费POC验证,效果达标后再合作。零风险落地应用大模型,已交付160+中大型企业

联系我们

售前咨询
186 6662 7370
预约演示
185 8882 0121

微信扫码

添加专属顾问

回到顶部

加载中...

扫码咨询