2026年6月4日 周四晚上19:30,报名腾讯会议了解“业务抓夹如何成为前线部署工程师(FDE)”(限30人)
免费POC, 零成本试错
FDE知识库

FDE知识库

学习大模型的前沿技术与行业落地应用


我要投稿

企业级 AI Agent 为什么集体转向“基座 + Skills”?

发布日期:2026-05-30 17:46:47 浏览次数: 1528
作者:多模态智能体

微信搜一搜,关注“多模态智能体”

推荐语

这篇文章揭示了企业级 AI Agent 架构演进的必然趋势,剖析了为何“基座+Skills”模式正成为主流。

核心内容:
1. 传统 AI Agent 开发模式面临的困境与挑战
2. OpenClaw 提出的“空壳哲学”与解耦架构
3. “基座+Skills”模式的实际运作机制与优势

杨芳贤
53AI创始人/腾讯云(TVP)最具价值专家
我认识一个做了十几年软件的老朋友,去年跟我说了一句话,我一直没忘:
"现在搞 AI Agent,感觉像在用胶布拼飞机。"
他当时在做一个内部法务审查 Agent,光是 Prompt 调了两个月,工具链加了删、删了加,最后系统一升级,全崩了,从头再来。
这不是他一个人的故事。2023、2024、2025 年那批"重型开发者",几乎都踩过同一个坑:把所有逻辑硬写进主程序,越写越重,越重越脆,一个需求变化就得大动手术。
直到 OpenClaw 出现,很多人才意识到——问题不是出在执行上,而是出在架构观念上。

一、37 万 +Star 背后,是一场开发者的集体"出走"
截至今年初,OpenClaw 在 GitHub 上的 Star 数已经逼近 20 万。
这个数字放在开源社区里是什么概念?它已经超过了当年风头无两的 AutoGPT,也把工程复杂度臭名昭著的 LangChain 远远甩在身后。
但 Star 数从来不是重点。重点是:这 37 万+人为什么要迁移过来?
AutoGPT 死在了太过激进。它早早提出了自主 Agent 的概念,但在工程落地层面几乎是一场灾难——任务跑偏、循环幻觉、资源失控,演示酷炫,生产不可用。
LangChain 死在了另一个极端。框架太重,抽象层太多,写一个简单的 RAG 流程要引入几十个依赖,代码一多,没人看得懂自己写了什么。
两条路都走不通,开发者开始找第三条路。
OpenClaw 给出的答案,说起来出乎意料地简单:把 Agent 做空,把能力做轻。

二、"空壳哲学":一个反直觉的架构选择
如果你第一次接触 OpenClaw,可能会感到困惑——它的核心框架几乎什么都没有。
没有内置的财务分析逻辑,没有预装的爬虫工具,没有硬编码的工作流。你装完它,打开一看,就是个极简的调度器。
这让很多人的第一反应是:这东西能干什么?
但这恰恰是它的设计哲学所在。
OpenClaw 的创始团队有一个核心判断:传统 Agent 之所以越来越难维护,根本原因是"能力"和"调度"混在了一起。 Prompt 写死,Tool 写死,工作流写死,改一处,动全身。随着任务越来越复杂,Context Window 被撑爆,多 Tool 开始互相干扰,Prompt 污染日益严重。
他们的解法是彻底的解耦:核心只负责一件事——调度。所有能力,全部外挂。
这就是"Everything is a Skill"——万物皆技能。
用一个不那么技术的比喻来说:就像一台刚出厂的电脑,系统是干净的,什么软件都没装。你想写文档,就装 Office;想修图,就装 Photoshop;想剪视频,就装 PR。OpenClaw 就是那个操作系统,Skills 就是你按需安装的专业软件。
区别在于,它比装软件还快——不是点击安装等进度条,而是任务一来,能力自动加载;任务结束,自动卸载,Context 清空,资源释放。

三、它实际上怎么运行的?
说具体点,当你对 OpenClaw 说"帮我分析一下这份财报",后台发生了什么?
第一步,系统解析你的意图,识别出这是一个财务分析任务。
第二步,它去 ClawHub(OpenClaw 的技能仓库)拉取对应的 Financial_Analysis_Skill,把这个技能包里的 Prompt 模板、Tool 配置、执行逻辑全部注入当前上下文。
第三步,任务执行完毕,技能包卸载,主 Agent 恢复到"空"的状态,等待下一个任务。
整个过程,主框架始终是轻量的。变的只是挂载了哪个技能,而不是主程序本身。
这看起来是个技术细节,但它带来的工程意义是巨大的:你不再需要为每个场景维护一套庞大的 Agent,你只需要维护一套标准的 Skill。

四、ClawHub:护城河不在代码里,而在生态里
很多人评价一个开源项目,第一反应是看代码质量。但 OpenClaw 真正难以复制的,其实不是它的代码。
是 ClawHub。
ClawHub 是 OpenClaw 的技能仓库平台,目前已经汇聚了全球开发者贡献的超过 6.5万+个标准化 Skills。K8s 集群管理、财务报表分析、法律合同审查、小红书热帖追踪、飞书自动化推送……几乎你能想到的业务场景,上面都有现成的技能包可以直接拿来用。
这意味着什么?
意味着以前需要一个工程师花半个月写的工作流,现在可能只需要在 ClawHub 上搜一下,下载,挂载,运行。
这种效率的变化,不是量变,是质变。
当然,生态能走多远,关键在于标准是否统一。OpenClaw 的 skill.yaml 协议解决了这个问题——所有 Skill 都按照统一格式定义输入输出规范、Tool 依赖关系、Prompt 模板、Memory 规则和权限控制。任何一个符合协议的 Skill,都能在任何 OpenClaw 实例里直接运行,不需要任何适配工作。
这就是为什么我说 ClawHub 是护城河——不是因为它大,而是因为它形成了一套别人很难绕开的标准。
类比一下:Android 的核心竞争力从来不是安卓系统本身,而是 Google Play 背后那个庞大的应用生态。一旦开发者都在这套标准里写 Skill,用户都在这个平台上找 Skill,这个生态就会自我强化,越来越难被替代。

五、最让我震惊的功能:它会自己"造工具"
如果说前面讲的都是"怎么用 Skill",那 OpenClaw 最令人意外的地方,是它会自己创造 Skill
这个功能叫做"自主技能提炼"(Autonomous Skill Refinement)。
举个具体的例子。假设你告诉 OpenClaw:"我希望每天早上八点,自动去 arXiv 抓取最新的 AI 论文,把摘要翻译成中文,然后推送到我的飞书群。"
传统做法:你得找工程师,写爬虫,写调度脚本,配飞书 API,测试,上线,维护。少则一周,多则更长。
OpenClaw 的做法:它先帮你把这个流程执行一遍,验证可行。然后你对它说:"把这个流程固化成一个 Skill。"它会自动把刚才的执行路径——Prompt 策略、API 调用顺序、Tool 使用逻辑、错误处理机制——全部打包成一个标准的 Skill 文件。你可以上传到 ClawHub 分享给所有人,也可以私有化保留在自己的环境里。
这个设计的深意在哪?
传统软件开发的逻辑是:人写程序,用户使用程序。
OpenClaw 的逻辑是:用户使用,AI 自动生成程序。
"使用即开发",这四个字说起来简单,但它意味着 Agent 开发的门槛从"会写代码"降低到了"会描述需求"。这件事的长期影响,怎么高估都不为过。

六、"基座 + 技能",为什么能打败垂域 Agent?
说到这里,有一个更大的问题值得认真讨论:OpenClaw 的崛起,是否意味着"训练专用垂域 Agent"这条路走不通了?
先看历史。2023、2024 年,业界有一种几乎不容置疑的共识:要解决垂直领域的问题,必须构建垂直领域的 Agent。做法是:收集海量领域数据,微调模型,构建专属 RAG 系统,甚至重新设计模型架构。
成本呢?极高。周期呢?极长。效果呢?能用,但往往泛化能力差,一旦任务稍微跑出训练分布,就容易翻车。
OpenClaw 提出了一个反其道而行之的答案:通用大模型 + Agent Skills = 解决垂域问题。
这个公式为什么成立?有两个底层逻辑支撑。
第一,商业场景符合二八定律。
绝大多数企业的"垂域需求",其实并不真的需要一个"领域专家级"的 AI。一家普通公司审查一份采购合同,或者起草一份保密协议——这些虽然属于法律场景,但所需的知识是标准化的,流程是固定的。
对于这 80% 的场景,你不需要训练一个昂贵的法律专用模型。你只需要给一个足够聪明的通用 Agent,挂载一个包含法律 SOP 和合规检查清单的 Skill,它就能以 90 分的水准完成任务。
Skill 的本质,说白了就是把专家的经验和流程,封装成大模型能直接读懂的"外挂说明书"。
第二,基座模型的能力正在经历"摩尔定律"式的跃升。
2026 年的通用基座模型,无论是推理能力还是泛化能力,都已经远远超过了 2024 年经过微调的专用小模型。
换句话说,以前我们改模型来适应任务;现在,只需要换个 Skill 就够了。底座越强,Skill 的杠杆效应就越大。

七、但有些硬骨头,还是得专门啃
说了这么多"基座 + Skills"的好,我必须把话说完整:这条路并不是万能的。
有一类场景,通用 Agent 加 Skill 就是干不好——那就是高度专业、逻辑深度极深的领域。
最典型的例子是编程。
写一个简单的 Python 脚本,通用 Agent 完全没问题。但如果你要对一个百万行级别的代码库做全局重构,或者调查一个复杂的并发竞态 Bug,通用 Agent 就会显得力不从心。这类任务需要的不只是"挂载一个 Coding Skill",而是对模型本身进行针对代码逻辑的深度强化训练,配合专门的编译器理解能力和沙箱执行环境。
这也是为什么 Claude Code 和 Codex 这类专用编程 Agent 依然有其独立存在的价值。
说到底,未来的 Agent 世界可能会形成清晰的两层结构:
第一层:通用 Agent + Skills,横扫 80% 的标准化企业需求,门槛低,部署快,维护成本极低。
第二层:超级垂域 Agent,专门解决科研、高端医疗、核心系统编程、金融量化等高复杂度场景,是真正的"硬骨头专家"。
这两层不是谁替代谁,而是各安其位,互补共存。

八、落地案例:Skills 在真实企业里是什么样的?
理论说够了,来看几个真实的落地场景。
内容运营团队:用 OpenClaw 挂载小红书热帖追踪 Skill,每天自动抓取爆文,分析关键词和内容结构,生成选题建议。原来需要两个人盯盘,现在一个 Agent 每天早上给你报告,运营专注于创作本身。
财务分析岗:财报一上传,挂载 Financial Analysis Skill,自动提取核心指标,标注异常数据,生成经营分析摘要,还能结合 SQL Skill 直接查内部数据库对比历史数据。
DevOps 团队:K8s 集群出现异常,Agent 挂载运维诊断 Skill,自动拉取日志,定位根因,生成修复建议,还能把处理流程固化成新的 Skill 留给下次用。
法务支持:合同上传,Law Review Skill 逐条对照合规清单,标注风险条款,生成审查报告。不是替代法务,而是把法务从重复性工作里解放出来。
这些场景有一个共同点:不是用 AI 替代人,而是用 Skill 把人从低价值重复劳动里解放出来,专注于真正需要判断力的事情。

九、工程师该怎么应对这个变化?
OpenClaw 的崛起,对大模型工程师意味着什么?
我认为技能树需要重新点。
第一步,学会"用" Skills。 这是最基础的。理解 Agent Skills 的标准运行机制,知道怎么在 ClawHub 上找到合适的技能包,怎么配置和调用它,怎么把它组合成解决业务问题的完整方案。
第二步,学会"造" Skills。 这才是真正有价值的地方。把你自己对某个业务场景的理解——SOP 流程、Prompt 策略、工具链配置——打包成标准化的 Skill 文件。这不是写代码,而是把专业经验结构化。
第三步,学会"搭"能跑 Skills 的 Agent。 这是架构层面的能力。从底层开发出支持动态挂载、卸载、调度 Skills 的运行环境,理解 Context Engineering 和 Skill Orchestration 背后的设计逻辑。
未来真正值钱的工程师,可能不是会写 Prompt 的人,而是会设计 Skill 架构的人。

尾声
软件时代,我们下载 App。 Agent 时代,我们加载 Skills。
这句话说起来像口号,但背后有一个真实的趋势在支撑:AI 的竞争,正在从"谁的模型更聪明",转向"谁的能力生态更完整"。
OpenClaw 的野心,从来不是做一个更好用的聊天机器人,而是成为 AI 世界的能力操作系统——一个让任何人都能按需调用、按需创造、按需进化 AI 能力的基础设施。
这件事成不成得了,时间会给答案。但有一点几乎可以确定:在这场生态之战里,先上手、先积累 Skill 的人,会比别人早一步建立真正的护城河。

53AI,企业落地大模型首选服务商

产品:场景落地咨询+大模型应用平台+行业解决方案

承诺:免费POC验证,效果达标后再合作。零风险落地应用大模型,已交付160+中大型企业

联系我们

售前咨询
186 6662 7370
预约演示
185 8882 0121

微信扫码

添加专属顾问

回到顶部

加载中...

扫码咨询