我要投稿

企业级 AI Agent 为什么集体转向“基座 + Skills”？

发布日期：2026-05-30 17:46:47 浏览次数： 1528

作者：多模态智能体

微信搜一搜，关注“多模态智能体”

我认识一个做了十几年软件的老朋友，去年跟我说了一句话，我一直没忘：

"现在搞 AI Agent，感觉像在用胶布拼飞机。"

他当时在做一个内部法务审查 Agent，光是 Prompt 调了两个月，工具链加了删、删了加，最后系统一升级，全崩了，从头再来。

这不是他一个人的故事。2023、2024、2025 年那批"重型开发者"，几乎都踩过同一个坑：把所有逻辑硬写进主程序，越写越重，越重越脆，一个需求变化就得大动手术。

直到 OpenClaw 出现，很多人才意识到——问题不是出在执行上，而是出在架构观念上。

一、37 万 +Star 背后，是一场开发者的集体"出走"

截至今年初，OpenClaw 在 GitHub 上的 Star 数已经逼近 20 万。

这个数字放在开源社区里是什么概念？它已经超过了当年风头无两的 AutoGPT，也把工程复杂度臭名昭著的 LangChain 远远甩在身后。

但 Star 数从来不是重点。重点是：这 37 万+人为什么要迁移过来？

AutoGPT 死在了太过激进。它早早提出了自主 Agent 的概念，但在工程落地层面几乎是一场灾难——任务跑偏、循环幻觉、资源失控，演示酷炫，生产不可用。

LangChain 死在了另一个极端。框架太重，抽象层太多，写一个简单的 RAG 流程要引入几十个依赖，代码一多，没人看得懂自己写了什么。

两条路都走不通，开发者开始找第三条路。

OpenClaw 给出的答案，说起来出乎意料地简单：把 Agent 做空，把能力做轻。

二、"空壳哲学"：一个反直觉的架构选择

如果你第一次接触 OpenClaw，可能会感到困惑——它的核心框架几乎什么都没有。

没有内置的财务分析逻辑，没有预装的爬虫工具，没有硬编码的工作流。你装完它，打开一看，就是个极简的调度器。

这让很多人的第一反应是：这东西能干什么？

但这恰恰是它的设计哲学所在。

OpenClaw 的创始团队有一个核心判断：传统 Agent 之所以越来越难维护，根本原因是"能力"和"调度"混在了一起。 Prompt 写死，Tool 写死，工作流写死，改一处，动全身。随着任务越来越复杂，Context Window 被撑爆，多 Tool 开始互相干扰，Prompt 污染日益严重。

他们的解法是彻底的解耦：核心只负责一件事——调度。所有能力，全部外挂。

这就是"Everything is a Skill"——万物皆技能。

用一个不那么技术的比喻来说：就像一台刚出厂的电脑，系统是干净的，什么软件都没装。你想写文档，就装 Office；想修图，就装 Photoshop；想剪视频，就装 PR。OpenClaw 就是那个操作系统，Skills 就是你按需安装的专业软件。

区别在于，它比装软件还快——不是点击安装等进度条，而是任务一来，能力自动加载；任务结束，自动卸载，Context 清空，资源释放。

三、它实际上怎么运行的？

说具体点，当你对 OpenClaw 说"帮我分析一下这份财报"，后台发生了什么？

第一步，系统解析你的意图，识别出这是一个财务分析任务。

第二步，它去 ClawHub（OpenClaw 的技能仓库）拉取对应的 Financial_Analysis_Skill，把这个技能包里的 Prompt 模板、Tool 配置、执行逻辑全部注入当前上下文。

第三步，任务执行完毕，技能包卸载，主 Agent 恢复到"空"的状态，等待下一个任务。

整个过程，主框架始终是轻量的。变的只是挂载了哪个技能，而不是主程序本身。

这看起来是个技术细节，但它带来的工程意义是巨大的：你不再需要为每个场景维护一套庞大的 Agent，你只需要维护一套标准的 Skill。

四、ClawHub：护城河不在代码里，而在生态里

很多人评价一个开源项目，第一反应是看代码质量。但 OpenClaw 真正难以复制的，其实不是它的代码。

是 ClawHub。

ClawHub 是 OpenClaw 的技能仓库平台，目前已经汇聚了全球开发者贡献的超过 6.5万+个标准化 Skills。K8s 集群管理、财务报表分析、法律合同审查、小红书热帖追踪、飞书自动化推送……几乎你能想到的业务场景，上面都有现成的技能包可以直接拿来用。

这意味着什么？

意味着以前需要一个工程师花半个月写的工作流，现在可能只需要在 ClawHub 上搜一下，下载，挂载，运行。

这种效率的变化，不是量变，是质变。

当然，生态能走多远，关键在于标准是否统一。OpenClaw 的 skill.yaml 协议解决了这个问题——所有 Skill 都按照统一格式定义输入输出规范、Tool 依赖关系、Prompt 模板、Memory 规则和权限控制。任何一个符合协议的 Skill，都能在任何 OpenClaw 实例里直接运行，不需要任何适配工作。

这就是为什么我说 ClawHub 是护城河——不是因为它大，而是因为它形成了一套别人很难绕开的标准。

类比一下：Android 的核心竞争力从来不是安卓系统本身，而是 Google Play 背后那个庞大的应用生态。一旦开发者都在这套标准里写 Skill，用户都在这个平台上找 Skill，这个生态就会自我强化，越来越难被替代。

五、最让我震惊的功能：它会自己"造工具"

如果说前面讲的都是"怎么用 Skill"，那 OpenClaw 最令人意外的地方，是它会自己创造 Skill。

这个功能叫做"自主技能提炼"（Autonomous Skill Refinement）。

举个具体的例子。假设你告诉 OpenClaw："我希望每天早上八点，自动去 arXiv 抓取最新的 AI 论文，把摘要翻译成中文，然后推送到我的飞书群。"

传统做法：你得找工程师，写爬虫，写调度脚本，配飞书 API，测试，上线，维护。少则一周，多则更长。

OpenClaw 的做法：它先帮你把这个流程执行一遍，验证可行。然后你对它说："把这个流程固化成一个 Skill。"它会自动把刚才的执行路径——Prompt 策略、API 调用顺序、Tool 使用逻辑、错误处理机制——全部打包成一个标准的 Skill 文件。你可以上传到 ClawHub 分享给所有人，也可以私有化保留在自己的环境里。

这个设计的深意在哪？

传统软件开发的逻辑是：人写程序，用户使用程序。

OpenClaw 的逻辑是：用户使用，AI 自动生成程序。

"使用即开发"，这四个字说起来简单，但它意味着 Agent 开发的门槛从"会写代码"降低到了"会描述需求"。这件事的长期影响，怎么高估都不为过。

六、"基座 + 技能"，为什么能打败垂域 Agent？

说到这里，有一个更大的问题值得认真讨论：OpenClaw 的崛起，是否意味着"训练专用垂域 Agent"这条路走不通了？

先看历史。2023、2024 年，业界有一种几乎不容置疑的共识：要解决垂直领域的问题，必须构建垂直领域的 Agent。做法是：收集海量领域数据，微调模型，构建专属 RAG 系统，甚至重新设计模型架构。

成本呢？极高。周期呢？极长。效果呢？能用，但往往泛化能力差，一旦任务稍微跑出训练分布，就容易翻车。

OpenClaw 提出了一个反其道而行之的答案：通用大模型 + Agent Skills = 解决垂域问题。

这个公式为什么成立？有两个底层逻辑支撑。

第一，商业场景符合二八定律。

绝大多数企业的"垂域需求"，其实并不真的需要一个"领域专家级"的 AI。一家普通公司审查一份采购合同，或者起草一份保密协议——这些虽然属于法律场景，但所需的知识是标准化的，流程是固定的。

对于这 80% 的场景，你不需要训练一个昂贵的法律专用模型。你只需要给一个足够聪明的通用 Agent，挂载一个包含法律 SOP 和合规检查清单的 Skill，它就能以 90 分的水准完成任务。

Skill 的本质，说白了就是把专家的经验和流程，封装成大模型能直接读懂的"外挂说明书"。

第二，基座模型的能力正在经历"摩尔定律"式的跃升。

2026 年的通用基座模型，无论是推理能力还是泛化能力，都已经远远超过了 2024 年经过微调的专用小模型。

换句话说，以前我们改模型来适应任务；现在，只需要换个 Skill 就够了。底座越强，Skill 的杠杆效应就越大。

七、但有些硬骨头，还是得专门啃

说了这么多"基座 + Skills"的好，我必须把话说完整：这条路并不是万能的。

有一类场景，通用 Agent 加 Skill 就是干不好——那就是高度专业、逻辑深度极深的领域。

最典型的例子是编程。

写一个简单的 Python 脚本，通用 Agent 完全没问题。但如果你要对一个百万行级别的代码库做全局重构，或者调查一个复杂的并发竞态 Bug，通用 Agent 就会显得力不从心。这类任务需要的不只是"挂载一个 Coding Skill"，而是对模型本身进行针对代码逻辑的深度强化训练，配合专门的编译器理解能力和沙箱执行环境。

这也是为什么 Claude Code 和 Codex 这类专用编程 Agent 依然有其独立存在的价值。

说到底，未来的 Agent 世界可能会形成清晰的两层结构：

第一层：通用 Agent + Skills，横扫 80% 的标准化企业需求，门槛低，部署快，维护成本极低。

第二层：超级垂域 Agent，专门解决科研、高端医疗、核心系统编程、金融量化等高复杂度场景，是真正的"硬骨头专家"。

这两层不是谁替代谁，而是各安其位，互补共存。

八、落地案例：Skills 在真实企业里是什么样的？

理论说够了，来看几个真实的落地场景。

内容运营团队：用 OpenClaw 挂载小红书热帖追踪 Skill，每天自动抓取爆文，分析关键词和内容结构，生成选题建议。原来需要两个人盯盘，现在一个 Agent 每天早上给你报告，运营专注于创作本身。

财务分析岗：财报一上传，挂载 Financial Analysis Skill，自动提取核心指标，标注异常数据，生成经营分析摘要，还能结合 SQL Skill 直接查内部数据库对比历史数据。

DevOps 团队：K8s 集群出现异常，Agent 挂载运维诊断 Skill，自动拉取日志，定位根因，生成修复建议，还能把处理流程固化成新的 Skill 留给下次用。

法务支持：合同上传，Law Review Skill 逐条对照合规清单，标注风险条款，生成审查报告。不是替代法务，而是把法务从重复性工作里解放出来。

这些场景有一个共同点：不是用 AI 替代人，而是用 Skill 把人从低价值重复劳动里解放出来，专注于真正需要判断力的事情。

九、工程师该怎么应对这个变化？

OpenClaw 的崛起，对大模型工程师意味着什么？

我认为技能树需要重新点。

第一步，学会"用" Skills。这是最基础的。理解 Agent Skills 的标准运行机制，知道怎么在 ClawHub 上找到合适的技能包，怎么配置和调用它，怎么把它组合成解决业务问题的完整方案。

第二步，学会"造" Skills。这才是真正有价值的地方。把你自己对某个业务场景的理解——SOP 流程、Prompt 策略、工具链配置——打包成标准化的 Skill 文件。这不是写代码，而是把专业经验结构化。

第三步，学会"搭"能跑 Skills 的 Agent。这是架构层面的能力。从底层开发出支持动态挂载、卸载、调度 Skills 的运行环境，理解 Context Engineering 和 Skill Orchestration 背后的设计逻辑。

未来真正值钱的工程师，可能不是会写 Prompt 的人，而是会设计 Skill 架构的人。

尾声

软件时代，我们下载 App。 Agent 时代，我们加载 Skills。

这句话说起来像口号，但背后有一个真实的趋势在支撑：AI 的竞争，正在从"谁的模型更聪明"，转向"谁的能力生态更完整"。

OpenClaw 的野心，从来不是做一个更好用的聊天机器人，而是成为 AI 世界的能力操作系统——一个让任何人都能按需调用、按需创造、按需进化 AI 能力的基础设施。

这件事成不成得了，时间会给答案。但有一点几乎可以确定：在这场生态之战里，先上手、先积累 Skill 的人，会比别人早一步建立真正的护城河。

53AI，企业落地大模型首选服务商

产品：场景落地咨询+大模型应用平台+行业解决方案

承诺：免费POC验证，效果达标后再合作。零风险落地应用大模型，已交付160+中大型企业