我要投稿

如何为你的 Skills 构建自我改进循环

发布日期：2026-06-19 15:56:47 浏览次数： 1598

作者：AI咖啡馆

微信搜一搜，关注“AI咖啡馆”

自我改进循环流程图：内循环处理新问题分类，外循环根据反馈更新技能

导读

Zach Lloyd（Warp 创始人，前Google Doc首席工程师）分享了如何用「内循环 + 外循环」架构让 AI Agent 持续改进自己的 Skills。内循环负责执行任务（如 Issue 分类），外循环定期审查执行记录、根据人类反馈修改 Skill 文件，形成自我改进的闭环。整套方案基于 GitHub Actions + 云端 Agent 实现，已用于 Warp 开源仓库的日常管理。

最近关于用「循环（loop）」来驱动 Agent 的讨论很多，但我觉得随之而来的一个问题是——「循环」到底是指什么？

我没法代表所有使用这个术语的人发言，但我想展示一种实践方法，利用 Skills 和云端 Agent 来实现一种特别强大的循环：自我改进循环。

这个概念的核心是：Agent 可以根据外部反馈，随时间推移提升自身 Skills 的质量。我的例子中包含了一个人类反馈步骤，但如果你的目标明确且不需要人类参与，同样可以用自动化评估器（automated grader）来实现。

为了说得具体些，假设这个 Skill 负责Issue 分诊（issue triage），将收到的 Issue 分为几类：可以实施（ready-to-implement）、重复（duplicate）、需要补充信息（needs-info）。同样的方法也适用于代码审查 Skill、Bug 修复 Skill、事故响应 Skill 等等。

以下是这个 Skill 的初版草案可能的样子：

Triage Issue 技能文档，包含技能描述、版本和操作步骤

你需要搭建以下几个循环：

内循环（inner agent loop）：这是你实际应用 Skill 的地方。对于 Issue 分诊，你可以手动运行，但更可能的做法是通过与任务追踪器的集成，在每次新建 Issue 时自动运行 Skill。与 Skill 的交互记录会被保存到某个地方：文件中、Agent 执行轨迹中，或者 Slack、GitHub 等外部系统的交互记录中。

外循环（outer agent loop）：这是一个按计划运行的 Agent，负责观察内循环中 Skill 的使用情况。对于 Issue 分诊器来说，这通常是一个云端 Agent，会拉取每次分诊 Agent 运行的记录。它的工作是审查内循环 Agent 的所有运行记录，并根据这些运行的表现来调整 Skill。由于 Skills 本质上就是文件，这意味着它应该根据过去运行中的用户反馈生成一个 diff 来改进 Skill。

接下来我用 Warp 和 Oz（我们的云端 Agent 平台）来演示具体实践，但实现方式有很多种。我们将使用 GitHub Issues 作为 Issue 追踪器。

这里有一个示例仓库，包含可以跟着操作的 Skills 和 GitHub Workflows。

第一步：搭建内循环

内循环使用一个 GitHub Action，在每次创建新 Issue 时触发运行。

GitHub Actions 工作流配置文件，用于新建问题时触发分类

GitHub Actions 机器人将问题标记为 ready-to-implement 并请求反馈

这个 GitHub Action 通过 Oz（Warp 的云端 Agent 平台）调用一个云端 Agent。该云端 Agent 会同步仓库、从 GitHub 拉取 Issue 内容，然后尝试对其进行分类。具体的设置代码在下面链接的仓库中。

现在，每当一个新 Issue 进来，云端 Agent 就会运行内循环的分诊 Skill，并打上一个标签，表示有一个新的功能请求已经可以实施了。

第二步：搭建用于自我改进的外循环

假设人类审阅者不认同 Agent 的分类结果。作为审阅者，我把 Issue 从「可以实施」改为「需要补充信息」，并在讨论串中评论说明分类错误的原因——比如，对于是否要为这个新功能添加设置项还存在歧义。

这就是外循环变得有趣的地方。外循环 Agent 每天运行一次，检查所有已分诊的 Issue。当它运行时，会发现我手动调整了标签并给出了原因。

人类审阅者评论：是否需要添加设置以及模糊情况的处理方式

Improve Triage Skill 技能文档，介绍改进问题分类技能的步骤

由于外循环 Agent 的 Skill 是通过编程 Agent 运行的，它会根据我提供的反馈生成一个 diff 来更新分诊 Skill。

代码编辑界面展示 triage-issue 技能从 v1 到 v2 的修改差异

一旦这个 diff 被合并，它就会反馈到驱动内循环 Agent 的 Skill 中，下一次 Agent 运行时，Skill 的表现就会更好。

内循环与外循环完整流程图：从新问题到技能更新的闭环

很想知道这对大家是否有用。我们用自我改进循环来管理 Warp 的开源仓库，并把背后的框架提取出来供其他人采用。早期版本在这里。

53AI，企业落地大模型首选服务商

产品：场景落地咨询+大模型应用平台+行业解决方案

承诺：免费POC验证，效果达标后再合作。零风险落地应用大模型，已交付160+中大型企业

相关资讯

2026-06-26

QoderWork Skills 开发实践：从传统数科到 AI 数科的转型探索-我的Skills进阶之旅

2026-06-23

如何高效管理多 Agent 散落各处的 Skills?

2026-06-23

基于 AntV 做了一个 AI 数据报告生成 Skill，顺手沉淀了一套 B 端 AI 管理界面框架

2026-06-23

测试从业者必备的 8 个 Claude Skills：从用例设计到缺陷复盘，一次讲透

2026-06-22

Grill Me Skill, 让 AI 狠狠拷问我

2026-06-22

"宝玉做了一个 Skill，然后把它修了七遍"

2026-06-22

刚刚，Codex 大更新，你在电脑的操作正在成为 AI 经验包

2026-06-21

我是怎么把几十万的课程，蒸馏成公司 AI Skill 和内部使用网站

联系获取

联系获取

160+中大型企业正在使用53AI

立即咨询预约演示

把握AI发展的机遇，共同探索、共同进步

2025-01-22

如何打造基于GenAI的员工服务机器人

2025-01-22

热点资讯

26个PPT生成Skill，我做了一次系统梳理

2026-05-15

开源「女娲.skill」，你现在可以去蒸馏任何人！

2026-04-05

小红书开始内测Red Skill，笔记下面也能挂AI技能了！

2026-05-24

我做了个 Skill：让 AI 帮你生成 Logo 和图标

2026-04-16

做了3个 Skills，打通公众号自动排版发布流程。

2026-04-09

GitHub上最火的10个Claude Code Skills，装完效率翻倍

2026-05-06

我把Google官方SEO文档蒸馏成了一个SEO.skill

2026-04-14

40分钟学会Codex！“零基础”终级教程～【附完整文档】

2026-05-19

达尔文.skill正式发布，一个无限进化的skill系统！

2026-04-14

深度解析：Codex Pet Skill

2026-05-03

大家都在问

如何高效管理多 Agent 散落各处的 Skills?

2026-06-23

同样是一个Skill，凭啥有的skill卖5万？有的免费都没有用？

2026-06-11

装了一堆 Skill，为什么最后都删了？

2026-06-11

如何更科学、方向可控的实现 Skill 的“自进化”?

2026-06-09

为什么各大公司开始大张旗鼓搞Skill中台？

2026-06-08

大模型的Agent Skill功能，在LLM HTTP底层交互流中是怎么承载的？

2026-05-28

当我们在管 Skill 时，我们到底在管什么？

2026-05-19

怎么创建一个真正能干活的 Skills？

2026-05-09

热门标签

内容创作大模型技术个人提效 langchain llamaindex 多模态技术 RAG技术智能客服知识图谱模型微调 RAGFlow coze Dify Fastgpt Bisheng Qanything AI+汽车 AI+金融 AI+工业 AI+培训 AI+SaaS Skill 提示词技巧 AI+电商 AI面试数字员工 ChatBI AI知识库开源大模型智能营销智能硬件 FDE AI+医疗 MaxKB Palantir Glean Openclaw

应聘简历请发送至： ceo@53ai.com

联系我们

售前咨询

预约演示

微信扫码

添加专属顾问

回到顶部