我要投稿

OpenClaw 最佳实践：5条“基本原则”

发布日期：2026-02-24 11:07:31 浏览次数： 1549

作者：小哈公社

微信搜一搜，关注“小哈公社”

OpenClaw 这类 Agent 系统，最迷人的地方不在“会说”，而在“会做”。

一旦智能体开始动手抓网页、跑脚本、发邮件、定时巡检，世界就变了：它不再是一段对话，而是一套正在运行的流程。

这时候，很多人会经历同一种反差：

第一天：像开了外挂

第三天：开始走样、开始失忆

第七天：任务像野草一样长，表现杂乱无章不稳定

最后：又回到“偶尔用用”的工具状态

问题通常不在“模型不够强”，而在“没按系统的方式用系统”。

所以 Reddit 社区把最容易翻车、最容易失控、也最容易踩坑的地方，浓缩成5条基本原则：安全第一、文件即大脑（最重要）、模型分层、Cron 驱动、极简技能。

它们之所以叫“原则”，不是因为“听起来正确”，而是因为：只要系统想长期跑、想可复用、想能扩张，这些就是绕不过去的物理定律。

核心主旨其实就是一句话：

文件即大脑，零依赖即安全。最好的智能体架构是最简单的架构

下面逐条把每个细节拆开讲透。

原则1：安全第一：先把“刹车”装上，再谈“马力”

图里第一条写得很硬：

绝不盲装 ClawHub 技能
自己写 SKILL.md（纯 Markdown 即可）
含 scripts/ 的必须运行审查
只用内置工具最安全

并且给了一个更狠的结论：

零依赖 = 最优

为什么它能叫“原则”

因为智能体时代的风险，已经不是“它会不会胡说”，而是“它会不会乱做”。

一旦技能里带脚本（scripts/），就等于把一把钥匙交给了陌生人，钥匙能开哪扇门，靠运气。

所以这条原则不是道德劝告，而是工程底线：

不盲装：下载量不等于安全（这点在后面的坑里还会再强调）
先写 SKILL.md：先把流程变成“可读的说明书”，再考虑“可执行的代码”
脚本必须审查：任何能执行的东西，本质上都是供应链
只用内置工具最安全：内置工具的边界清楚，可控、可回滚、可复盘

先把“能干什么”收窄，系统才跑得久；先把风险关进笼子，效率才有意义。

没刹车的智能体，不叫智能体，叫事故发生器。

所谓安全，绝不是“相信”，而是“限制”。

原则2（最重要）：文件即大脑：把记忆从“聊天”搬到“硬盘”

图里写得非常明确：

所有上下文必须落地为文件，否则 compaction 后全部丢失

并列出了四个具体落点：

MEMORY.md 长期记忆
memory/*.md 每日日志
ACTIVE-TASK.md 工作记忆
工作中途也要 checkpoint

为什么它能叫“原则”

因为这里牵扯的是智能体系统最大的敌人：Compaction。

图里的 Key Insights 第一条就点名：

Compaction 是最大敌人
LLM 上下文窗口有限，compaction 会丢失未持久化的信息。
所有上下文必须落地为文件，这是整个系统的核心保障。

聊天窗口像一张白板，写满了就得擦；擦之前再“总结”一下，看似保留了重点，实际丢掉了细节。

而智能体做事，恰恰靠细节：参数、约束、历史决策、失败原因、边界条件……这些一丢，系统就会“断片”。

所以“文件即大脑”的本质是：把智能体的记忆，从短期对话迁移到长期可持久化介质。

这不是习惯问题，是系统能不能长期跑的问题。

对话是记忆的幻觉，文件才是记忆的实体。

能跑一下午的不算系统，能跑一整年的才算。

推荐结构：workspace 目录不是“美观”，是“操作系统的骨架”

图里把推荐目录结构直接给出来了（这不是示意，是“最小可用架构”）：













~/workspace/  SOUL.md         # 人格定义 —— 智能体的身份与价值观  MEMORY.md       # 长期记忆 —— 跨会话知识  ACTIVE-TASK.md  # 当前任务 —— 工作记忆 + checkpoint  HEARTBEAT.md    # 定时任务 —— Cron 心跳清单  memory/         # 日志目录    2026-02-22.md # 每日日志记录    2026-02-21.md  skills/         # 自定义技能    SKILL.md      # 纯 Markdown 技能说明

这里每个文件名都在说一句系统设计的大白话：

SOUL.md：先定义“它是谁”，再让它做事（身份决定边界）

MEMORY.md：长期事实放这里（跨会话还能用）

ACTIVE-TASK.md：当前只盯一件事的“工作台”，中途有 checkpoint

HEARTBEAT.md：所有定时任务统一在“心跳清单”里

memory/：每天留痕，像飞行记录仪

skills/SKILL.md：技能先从说明书开始，别先从脚本开始

目录结构不是整理癖，是系统的脊椎。文件名写对了，系统就会自己变得有边界。

原则3：模型分层：把模型当组织结构，而不是当神仙

图里写得很具体：

主智能体 Opus（协调、复杂推理）
子任务 Sonnet（5 倍性价比）
必须配置模型回退机制

并补了一句实用主义到底的备注：

可替换为其他测试过的模型来降低成本

为什么它能叫“原则”

因为这条背后是成本与稳定性的物理规律：

所有任务都用最强模型：贵，而且容易把“思考”浪费在“搬砖”上

所有任务都用便宜模型：省，但关键节点会崩

没有回退机制：系统遇到不确定就会卡住或胡来

所以分层的核心不是“省钱”，而是“可控”：

Opus像“总指挥”：拆解、判断、兜底

Sonnet像“执行队”：批量处理、整理、跑流程

回退机制像“升级通道”：不行就上更强的，关键时刻不赌运气

把模型当岗位，系统才像公司；把模型当神仙，系统就像祈福。

分层不是抠门，是把聪明用在刀刃上。

没有回退机制的智能体，等于没有“二次确认”的人生。

原则4：Cron 驱动：让智能体从“被叫才动”变成“自己按节奏跑”

图里第四条的原话是：

把晨报、收件箱、监控、扫描等全部定时化，合并为少数心跳任务，以减少任务碎片化。
并且明确提出：
HEARTBEAT.md 统一管理定时任务清单

Key Insights 第二条也把原因讲透：

心跳模式统一调度
将晨报、监控、收件箱扫描等合并为少数心跳任务，通过 HEARTBEAT.md 统一管理，避免定时任务碎片化。

为什么它能叫“原则”

因为智能体系统最怕两件事：

靠人盯着（人一离开，系统就停摆）
碎片化调度（定时任务一多，就互相干扰、难排查、难复盘）

Cron/心跳的意义就是：把系统从“对话工具”升级成“常驻进程”。

但图里强调了一个关键细节：不是把任务越拆越碎，而是合并为少数心跳任务。

这很重要：心跳像心脏，不是毛细血管。心跳越多，系统越乱。

没有心跳的智能体，只是会喘气的工具。把任务定时化，是让系统长出“节律”；把节律统一，是让系统长出“秩序”。

碎片化的 Cron 不叫自动化，叫定时制造混乱。

原则5：极简技能：最好的技能，往往一行代码都没有

图里第五条写得很“反技术崇拜”：

最好的技能往往连没有一行代码，只是一份写好的 SKILL.md，教智能体如何用内置工具完成任务。
并给了一个明确对比：
纯 Markdown 说明 > 复杂脚本

Key Insights 第三条同样强调：

技能 = 写得好的说明
最有效的技能是一份清晰的 Markdown 说明，教智能体调用内置工具。代码越少，安全性和可维护性越高。

为什么它能叫“原则”

因为“脚本化技能”的成本不在写，而在养：

环境差异、依赖冲突、版本升级
安全审计、权限控制、异常处理
维护人走了，技能就成孤儿

而 Markdown 技能像什么？

像餐馆的“标准做法”：盐放几克、火候几分钟、出品标准是什么？写清楚就能复用；换厨师也能做。

这也是为什么“极简技能”不是退步，而是高级：让流程成为资产，让执行成为可替换。

脚本让系统跑得快，说明书让系统跑得久。

代码越多，债越大；说明越清，命越长。

最强的自动化，不是写程序，是写清楚“怎么做才算对”。

Common Pitfalls：四个“最容易把系统搞崩”的坑

图上右侧给了四条常见翻车点，字字都像血泪史：

运行中改配置：可能导致状态不一致和不可预期行为

不读 Skills 就安装：含 scripts/ 的技能可能执行任意代码

信 ClawHub 下载量：下载量不等于安全性，需自行审查代码

让智能体无批量发邮件/推文：必须设置审批机制

这四条其实在说同一件事：智能体系统不是“玩具”，一旦接入执行层，就必须像生产系统一样治理。

运行中改配置：像飞机飞行中换发动机，能不出事吗

不读 Skills 就安装：像在公司电脑上随便装来路不明的 exe

信下载量：像相信“很多人买过”就一定安全，真出事了没人负责

无审批外发：像把公章放门口，自取自用

Safety Checklist：两条红线

图上安全清单只有两条，简短，但非常“底层”：

✅ 只用内置工具（web_fetch、web_search、exec）

✅ 含 scripts/ 的技能运行审查后再安装

这两条的共同点是：把系统的可执行边界锁死在“可理解、可审计”的范围内。

如果这两条做到了，系统可能不够花哨，但会非常稳：稳到可以沉淀、可以复利、可以长出来。

越是能长期跑的系统，越像“少即是多”。

智能体的高级感，不在功能多，而在失控少。

三条 Key Insights：把“为什么”再说一遍

图的底部给了三张“总结卡”，分别对应整个系统的三根主梁：

1）Compaction 是最大敌人

LLM 上下文窗口有限，compaction 会丢失未持久化信息。
所有上下文必须落地为文件，这是整个系统的核心保障。

不落盘，就等于没记住；没记住，系统就会重复犯错。

2）心跳模式统一调度

将晨报、监控、收件箱扫描等合并为少数心跳任务，通过 HEARTBEAT.md 统一管理，避免定时任务碎片化。

不统一，就会碎；一碎，就难管；难管，就必崩。

3）技能 = 写得好的说明

最有效的技能是一份清晰的 Markdown 说明，教智能体调用内置工具。
代码越少，安全性和可维护性越高。

流程清楚，执行就简单；执行简单，系统就可靠。

结尾：这5条为什么是“原则”？

因为它们不是某个模型、某个版本、某个社区的偏好，而是所有“能跑起来的智能体系统”必然会走到的共识：

安全第一：先控制可执行边界，系统才不会变成事故

文件即大脑：先解决“记忆可持续”，系统才不会断片

模型分层：先把成本与稳定性结构化，系统才不会又贵又不稳

Cron 驱动：先让系统有节律，智能体才从工具变成进程

极简技能：先把流程写清楚，系统才不会被脚本债务拖死

所以那句总纲才成立：

文件即大脑，零依赖即安全。最好的智能体架构是最简单的架构。

智能体最大的敌人不是笨，是乱。

能跑一周的是演示，能跑一年的是系统。

把复杂关在文件里，把风险关在边界里，OpenClaw 才会变成可复利的个人操作系统。

例子A：内容创作者

SOUL.md（身份与边界）角色：长期输出深度评论与行业分析的研究型创作者边界：不生成未经核验的数据结论；不自动对外发布；所有“事实性结论”需二次核查风格：评论型、口语化、低说教、高密度金句目标：形成“选题池 → 结构 → 论证 → 风险校验 → 投放复盘”的可复用生产线MEMORY.md（长期记忆）长期关注领域：AI Agent、OpenClaw 生态、模型商业化、软件行业冲击常用信息源：X、Reddit、Substack、行业报告、公司财报读者画像：偏商业与科技融合人群文章结构偏好：强钩子开头 + 分层拆解 + 结尾反思ACTIVE-TASK.md（当前任务）当前主线选题素材清单（来源 + 链接 + 可信度评级）结构大纲（章节目标 + 核心论点）风险点（争议观点、待核实数据）下一步动作（补充案例 / 查证数据 / 调整表达）HEARTBEAT.md（心跳调度）每日 08:30：扫描 X / Reddit 热点 → 写入 memory/当日日志每日 11:00：提取 3 个可写选题 → 更新 ACTIVE-TASK.md每周一 09:00：复盘上周文章数据表现 → 写入 MEMORY.md每周五 18:00：生成“选题池更新清单”skills/SKILL.md（技能说明）技能：行业热点评估触发：出现高热度 AI 话题输入：话题关键词步骤：web_search 收集 10 条一手讨论提炼 3 个分歧点给出“可写性评分（1–5）”输出：选题可写性评估表

例子B：投研（股票 / 行业 / AI 产业链）

SOUL.md角色：中长期基本面导向的研究助理边界：不生成投资建议，不自动下结论性买卖判断风格：结构化、对比分析、情绪克制目标：形成“信息扫描 → 逻辑拆解 → 估值对照 → 风险清单”的研究流水线MEMORY.md长期跟踪公司池（如：AI 基础设施、Agent OS 相关公司）常用估值方法（PS、EV/Sales、现金流折现简化模型）关键宏观变量（利率、算力成本、CapEx 周期）研究框架：产业链位置 + 护城河 + 商业化节奏ACTIVE-TASK.md当前研究标的最新财报要点（收入、增长率、毛利、CapEx）竞争对手对照市场预期 vs 实际差异未解问题与需补证据点HEARTBEAT.md每日 07:30：抓取财经新闻 → 摘要写入 memory/当日日志每周三 20:00：更新跟踪公司财报摘要每月 1 号：更新估值对照表财报季：T+1 日自动生成“市场反应 vs 基本面”对照skills/SKILL.md技能：财报快读输入：公司名称 + 财报链接步骤：web_fetch 抓取财报正文提取收入、增长率、利润率对比上一季度与市场预期输出：一页财报要点摘要