微信扫码
添加专属顾问
我要投稿
循环工程是AI交互的新范式,告别单轮prompt,构建自我迭代的智能系统。核心内容: 1. 循环工程的背景与硅谷热议 2. Loop Engineering的核心架构与五大组件 3. 从人机乒乓到系统自动进化的范式转变
硅谷最新诞生的概念:Loop Engineering
(1)Loop Engineering 背景
这几天,硅谷谈论最多的话题:Loop Engineering,循环工程,简称 LE
6月7日,谷歌云主管(Addy Osmani)发表博文,掀起热烈讨论:
地址见附录
OpenClaw作者 Peter Steinberger(江湖人称“虾爹”)说:
你不应该再去 prompting coding agent , 而是设计 loops,去 prompt agents。
Anthropic Claude Code 负责人 Boris Cherny(Claude 之父) 也说过:
我现在已经不直接 prompt Claude 了, 有一套 loops 在运行,会去 prompt Claude,并判断接下来要做什么。我的工作是写 loops。
(2)Loop Engineering 介绍
单纯靠堆Prompt指挥AI的时代已经落幕了。
过去两年,让 coding agent 做事的基本方式
Harness 是为单个 agent 构建运行环境,而Loop Engineering 则位于 harness 之上,像 Harness,但会按时间运行,获取反馈,并喂养自己。
这种人机乒乓球模式中,人类充当AI的实时调度器,一旦任务复杂,人的耐心的打字速度就成了系统交付瓶颈
范式转变:
PE是人类喂AI答案
LE是人类构建AI自动进化引擎
于是,不用再琢磨怎么说话更精准,而是设计这套loop法则:定义目标、质检标准,剩下的让系统在自我博弈中迭代完成,未来竞争力不再是回写prompt的人,而是那些设计出最聪明、最闭环系统的规则制定者。
claude code 的loop命令就是典型。
Loop Engineering 正在取代“亲自给 agent 写 prompt”。
loop 是递归目标:定义目标,让 AI 不断迭代,直到任务完成。
(3)Loop Engineering 架构
一张框架图概括LE,顺时针从12点方向开始看
LE 由五个构建块组成
Automations 自动化:按计划自动触发、发现和分诊。Worktrees 工作树:让两个并行工作的 agents 不会互相干扰。Skills 技能:把项目知识写下来,避免 agent 靠猜。Plugins 插件 和 connectors 连接器:把 agent 接入已经在用的工具。Sub-agents 子Agent:一个提想法,另一个检查。
另外,还有memory:markdown 文件,Linear board,或任何存在于单次 conversation 之外、能够保存“已完成事项”和“下一步事项”的地方。这五个核心模块在Claude Code 和 Codex 都已经具备:表格整理
| 自动化(Automations) | /goal 执行直到完成 | /loop、/goal、钩子、GitHub Actions | |
| 工作树(Worktrees) | git worktree--worktree 参数;在子代理上隔离工作树 | ||
| 技能(Skills) | SKILL.md),通过 $name 调用或隐式触发 | SKILL.md) | |
| 插件/连接器(Plugins / connectors) | |||
| 子代理(Sub-agents) | .codex/agents/ 目录下 | .claude/agents/ 目录下,支持代理团队协作 | |
| 状态(State) | AGENTS.md、进度文件)或通过 MCP 集成 Linear |
各模块细节略,详细介绍见文末技术博客
(4)LE认知
等等,看起来,LE不就是定时循环任务吗?
所以,Loop Engineering = cron job?
Loop Engineering 要反馈循环,就像开发团队要了解新功能、用户问题、工作流优化等。
LLM 可直接访问或生成数据,且要明确目标和验证输出结果的反馈循环。
YC CEO Garry Tan 提醒:
有人指出
(5)LE问题
LE虽好,但也别贪杯。
比如,LE模式存在字符膨胀问题,Token消耗太快等
① 调试难度大
调试跑 47 轮的状态机,比修好 prompt 难 10 倍,且大多数人连可靠的一次性 prompt 都写不好。
② Token消耗大
LE模式下,Token 消耗量高
怎么办?
工业界做法
③ 长任务稳定性
LE重点是让 Agent 长时间运行不跑偏,并能判断对错
Claude Code 是典型代表。
Anthropic 应用 AI 团队工程师 Ash 表示:公司探索方向更偏“尽量完全自主”,目标是把人类判断写入 Harness,而不是插入人工兜底。
去年,Claude Code 从只能连续运行约 20 分钟、易出错,进化到几乎由自己编写、可连续运行数天。
Anthropic 工程师 Andrew 指出:让 Agent 连续运行数小时甚至数天,核心难点有上下文、规划和自我判断。
为解此,Anthropic 采用两条路径:
早期长时运行 Agent 把需求拆解成持久化文件,在新上下文窗口中反复执行任务,缓解上下文丢失和任务漂移。
随着新模型能力增强,Anthropic 开始简化 Harness。
Anthropic 内部实验的前沿 Harness 模式是生成器—评估器—规划器结构,借鉴生成对抗网络思想。
附录
参考:
原文地址:https://addyosmani.com/blog/loop-engineering/
截图来自AI产品狙击手
技术报告专题:https://wqw547243068.github.io/loop
菜单栏“聊聊”->“大模型聊天”,或直接点击一下链接,可以体验多模态对话
53AI,企业落地大模型首选服务商
产品:场景落地咨询+大模型应用平台+行业解决方案
承诺:免费POC验证,效果达标后再合作。零风险落地应用大模型,已交付160+中大型企业
2026-06-10
更懂你的ChatGPT来了!通过做梦整理记忆,事实准确率83%
2026-06-10
Anthropic万字长文:当AI开始构建自己,人类该何去何从?
2026-06-10
Claude Fable 5正式发布 - 王者归航。
2026-06-10
什么是循环工程 Loop Engineering?loop 比 prompt 难 10 倍
2026-06-10
cc创始人对谈,Claude Code一周年回顾 :内部经历两次认知跃迁,第三次正在路上
2026-06-10
Anthropic 深夜大更新,Claude 正式进入Fable 时代
2026-06-10
突发!Anthropic深夜发布Claude Fable 5/Mythos 5,屠榜所有基准测试
2026-06-09
仅4B大小可端侧部署!卡帕西预言的「认知模型」被国产做出来了
2026-04-15
2026-04-07
2026-03-13
2026-03-31
2026-04-07
2026-03-17
2026-03-17
2026-03-21
2026-04-24
2026-04-17
2026-06-10
2026-06-10
2026-06-07
2026-06-06
2026-06-03
2026-06-02
2026-06-01
2026-05-26