微信扫码
添加专属顾问
我要投稿
AI Agent + Skills架构如何颠覆传统workflow?五步框架教你打造可进化的智能工作流。核心内容:1. 传统workflow编排的优势与局限性分析2. Agent+Skills架构的降维打击优势3. 五步框架实战:从写作到配图的可组合技能设计
“80 多个节点的 workflow,稳定性和可调整性,不是 subAgent 能比拟的”
上面这话这是我在 X 上和朋友 pippingg 的一次围绕 dify 这样可视化拖拽 workflow 和 Claude Code Skills 的一次讨论。
这话对,也不对。
对在哪里?传统 workflow 编排的确有它的核心价值——每次执行结果可预测,出了问题能一步步排查,普通人也能看懂流程图。这些优势实实在在。
不对在哪里?很多人低估了 AI Agent + Skills 架构的潜力。我的观点是:大部分 workflow 编排场景,都可以被 Agent + Skills 取代。
可视化工作流工具能火起来,是有道理的。
拖拽节点、连连线,一个自动化流程就搭好了。不用写代码,改起来也直观。更重要的是,它给你确定性——节点 A 执行完一定是节点 B,不会突然跳到节点 C。对于需要审计、需要合规的业务场景,这种确定性很重要。
但 workflow 编排也有硬伤。
它不够强大。可视化节点能做的事情有限,复杂逻辑很难表达。
它不够灵活。一旦流程定死,遇到输入变化就容易出错。你设计的流程是处理 A 类文档的,来了 B 类文档,整个流程可能就卡住了。
它难以移植。你搭了个很厉害的工作流,想给别人用?导出导入一通操作,还得在对方环境里调半天。平台锁定效应明显。
我的看法可能比较激进:几乎所有能用 workflow 完成的 AI 任务,都可以用 Agent + Skills 实现。
关键在于怎么理解 skill。很多人把 skill 当成单一技能——比如一个 skill 负责翻译,另一个负责总结。这样用太浪费了。
Skill 应该被看作可组合的模块。你可以把多个 skill 串起来,用自然语言描述它们之间的协作关系。换句话说,用自然语言去编排工作流,而不是用拖拽。
我总结了一个五步框架,用我自己的写作工作流来演示。
把工作流拆成单一职责的 skill 或 subagent。每个模块只做一件事,做好一件事。
以我的写作工作流为例,拆成了这些模块:
article-analyzer:分析素材,输出 analysis.mdoutliner:生成 2-3 个提纲方案writer-agent:根据提纲写草稿(可并行启动多个)polish:润色定稿再看配图工作流,也是同样的思路:
generate-image:原子技能,调用图像生成 APIarticle-illustrator:组合技能,分析文章内容,在需要视觉辅助的位置生成插图cover-image:组合技能,基于文章内容生成 2.35:1 的封面图然后写作和配图又可以组合成一个更完整的写作工作流。
你原来在 workflow 工具里画的每个功能节点,基本都可以对应一个 skill。
在主 skill 里用自然语言描述整个流程。不需要写代码,就像给同事交代任务一样说清楚就行。
比如我的 outliner 技能里会写:“先调用 article-analyzer 分析素材,分析完成后保存 analysis.md,然后根据分析结果生成 2-3 个不同风格的提纲方案,为每个方案并行启动 writer-agent 写草稿。”
条件分支、并行执行、错误处理,都可以用自然语言描述。Agent 能理解。
再看 article-illustrator 的编排逻辑:“读取文章内容,识别需要配图的位置(概念抽象处、信息密集处、情感转折处),为每个位置生成图像描述,调用 generate-image 生成图片,最后将图片插入文章对应位置。”
一个 skill 可以调用另一个 skill,组合出复杂的工作流。
这一步特别重要:所有中间结果都保存成本地文件。
三个好处:
我的文件结构是这样的:
source.md → analysis.md → outline-a.md → draft-outline-a.md → final.md
每一步的产出都有迹可循。配图流程同理,生成的图片按目录组织,和文章关联。
Subagent 之间只传文件路径,不传内容。
这条规则很重要。如果你把一大段内容直接塞给 subagent,上下文窗口很快就撑满了。但如果只传路径,subagent 自己去读文件,上下文就干净很多。
我的 writer-agent 启动时只需要三个参数:source 文件路径、analysis 文件路径、outline 文件路径。它自己读取内容,写完保存到指定路径,返回输出文件路径。
这样做还有个好处:可以并行启动多个 subagent。三个 writer-agent 同时跑,各自处理一个提纲方案,互不干扰。
这是 Agent + Skills 相比传统 workflow 最大的优势:可以持续进化。
发现某个 skill 的提示词不够好?让 Claude Code 帮你改。某个流程步骤可以优化?随时调整。你的 skills 会越用越好,而不是搭完就放在那儿吃灰。
这一点是 pippingg 在讨论中特别强调的:subagent 可以自己迭代 system prompt,配合一些自动化工具,甚至能完成自我迭代进化。在 token 和系统资源充足的情况下,这套系统会变得越来越强。
有人会说:你这套东西听起来挺美,但……
这是最有力的反驳。80 个节点的 workflow 确实经过了反复验证,每个分支都测试过,稳定性有保障。Agent 呢?每次执行可能走不同的路径,结果不可预测。
我的回应是:确定性逻辑不一定要交给 Agent。
你可以把需要确定性的部分写成脚本。那 80 个节点里,有多少是需要 AI 判断的?有多少只是固定的数据处理?固定的部分用脚本实现,skill 调用这个脚本就行。
举个例子,我的写作流程里有个格式化步骤:把中文引号换成全角、中英文之间加空格。这种规则明确的操作,我写了个 format-markdown.ts 脚本。polish 技能执行完润色后,自动调用这个脚本处理格式。
Anthropic 在设计 Skills 时也强调了这一点:“Skills 可以包含可执行代码,用于那些传统编程比 token 生成更可靠的任务。”这是混合架构的思路:代码处理确定性逻辑,Agent 处理需要判断的任务。两者各司其职,取长补短。
没错,Agent 执行确实更费 token。每调用一次模型都在烧钱,复杂任务可能要调用几十次。
但成本要算总账。
几个案例很说明问题。
Rakuten(乐天) 用 Claude Skills 处理财务报表,自动处理多个电子表格、捕捉关键异常、按公司流程生成报告。原本一天的工作现在一小时完成,8 倍效率提升。
Box 用 Skills 让用户可以即时将存储的文件转换为 PowerPoint、Excel、Word 文档,并自动遵循企业风格指南。为团队节省了数小时的手工操作。
这些案例说明:token 成本在整体效率提升面前根本不算什么。而且 Skills 采用“按需加载”的设计——只加载当前任务需要的信息,而不是把所有上下文都塞给模型。这本身就是在优化成本。
把 workflow 转化成 skill 需要抽象能力。普通用户搭可视化流程可以,让他写 skill 配置文件?太难了。
但这个问题正在被解决。AI 本身就能帮你创建 skill。借用 /skill-creator,你把需求描述清楚,Claude Code 可以帮你生成 skill 的配置。我自己就是这么干的——很多 skill 不是我手写的,是让 AI 帮我生成然后再调整。
长期来看,skill 比 workflow 更易维护。因为它是文本文件,可以用 Git 管理版本,可以代码审查,可以在不同机器间同步。Workflow 呢?锁在平台里,换个环境就得重来。
我不是说 workflow 毫无价值。两种方案各有适用场景。
Agent + Skills 更适合:
Workflow 仍有优势的场景:
Skill 架构有个经常被忽略的好处:它是活的,可以不断进化。
传统 workflow 一旦搭好,基本就定型了。改动需要人工介入,要小心测试,改完可能还会引入新问题。
但 skill 不一样。它是基于本地文件系统的,你可以让 Claude Code 帮你维护更新。用了一段时间,积累了一些问题,直接让 AI 分析并改进。
更激进一点的玩法是 pippingg 提到的:subagent 可以自我迭代 system prompt。
Claude Code 还有一个很强但很少人用的地方,是可以自己迭代 subagent 的 system prompt,配合 ralph-loop,已经可以完成自我迭代进化了。在 token 和系统资源充足的情况下,能进化成非常恐怖的存在。
听起来有点科幻,但已经有人在实践了。
McKinsey 的报告也印证了这一点:在一个法律文档审核流程中,agent 系统会记录每次人工修正,然后用这些反馈来改进自己的 prompt,逐渐将新的专业知识编码进系统。
这意味着什么?你投入时间打造的 skill,会随着使用越来越好。而不是像 workflow 那样,搭好就开始慢慢过时。
把你常用的 workflow 沉淀为 skill 吧。这不只是换个工具的问题,而是在积累可复用、可进化的自动化资产。
下次有人说“这个流程太复杂,只能用 workflow”,不妨想想:真的吗?还是只是没找到正确的拆分方式?
53AI,企业落地大模型首选服务商
产品:场景落地咨询+大模型应用平台+行业解决方案
承诺:免费POC验证,效果达标后再合作。零风险落地应用大模型,已交付160+中大型企业
2026-01-08
dify v1.11.2 又又三个坑,别踩了!
2026-01-06
Dify v1.11.2 今天又发现来3个缺陷,看看有什么影响?
2026-01-05
效率翻倍门槛减半:Vibe Coding + Claude-Code重构Dify开发
2026-01-04
别让你的 Obsidian 吃灰了!一键同步 Dify,打造最强本地知识库
2025-12-29
Dify版本升级过程记录(1.9.0升级至1.11.1版本,含weaviate数据迁移)
2025-12-27
Dify问题分类组件的性能优化之路:从13秒到毫秒级响应
2025-12-26
2025年最后正式版:dify v1.11.2 刚刚发布了!
2025-12-25
Dify v1.11.0:知识库支持多模态检索
2025-12-05
2025-12-08
2025-11-11
2025-11-09
2025-11-20
2025-12-05
2025-10-16
2025-11-01
2025-11-14
2025-11-17
2026-01-06
2025-12-21
2025-12-20
2025-12-17
2025-11-29
2025-09-30
2025-09-23
2025-09-06