我要投稿

Clawdbot值得借鉴的Agent架构设计经验

发布日期：2026-02-02 16:02:19 浏览次数： 1890

作者：AI技术立文

微信搜一搜，关注“AI技术立文”

Clawdbot（也称为Moltbot，最近又改名为OpenClaw）在Agent执行、工具使用、浏览器等方面的架构值得关注。深入了解Clawdbot的底层原理，有助于更好地理解其系统及能力，尤其是它擅长的地方，以及能力边界。

本文从技术层面介绍Clawdbot的工作原理，探讨它如何处理记忆和执行任务。

1Clawdbot的技术背景

Clawdbot是一种智能个人助理，既可以在本地运行，也可以通过模型API进行访问，使用方式类似手机上的应用程序。其核心技术是基于TypeScript的CLI应用程序，而不是Python、Next.js或者Web应用程序。它的工作方式包括：

在本地设备上运行，并提供网关服务器来处理所有的频道连接（如Telegram、WhatsApp、Slack等）。
调用LLM API（如Anthropic、OpenAI、本地等）。
在本地执行工具，并且可以在计算机上执行各种操作。

2架构

以下是Clawdbot处理信息的基本流程：

1. 频道适配器（Channel Adapter）
频道适配器接收消息并处理（标准化、提取附件等）。每种消息平台都有自己的适配器。

2. 网关服务器（Gateway Server）
网关服务器是任务/会话的协调者，它将消息传递到正确的会话。它是Clawdbot的核心，能够处理多个重叠的请求。为了序列化操作，Clawdbot使用基于车道（Lane）的命令队列。每个会话有自己的专用车道，低风险可并行执行的任务可以在不同的车道上并行执行（如定时任务）。

这种设计避免了常见的async/await混乱，过度并行化会破坏系统的可靠性，带来调试的噩梦。默认采用串行执行，只有明确要求时才会进行并行处理。

3. Agent执行器（Agent Runner）
Agent执行器负责选择使用哪个模型，挑选API密钥（如果没有密钥，它会标记配置并尝试下一个密钥）。如果主模型失败，它会回退到其他模型。Agent执行器动态组装系统提示，结合可用的工具、技能、记忆，并加入会话历史（从.jsonl文件中读取）。

接下来，Agent执行器将提示传递给上下文窗口守卫，确保上下文空间足够。如果上下文接近满负荷，它会压缩会话内容（总结上下文），或者在无法继续时优雅地退出。

4. LLM API调用（LLM API Call）
这个过程会流式传输响应，并在不同的提供商之间进行抽象。如果模型支持，Agent还可以请求扩展思考。

5. Agent循环（Agentic Loop）
如果LLM返回了工具调用响应，Clawdbot会在本地执行该工具，并将结果添加到会话中。这一过程会持续进行，直到LLM返回最终文本或者达到最大回合数（默认为20回合）。

6. 响应路径（Response Path）
这一部分比较标准，响应通过频道返回给用户。会话还会通过基本的JSONL格式进行持久化，每行一个JSON对象，包含用户消息、工具调用、结果、响应等。这是Clawdbot如何记住信息（基于会话的记忆）。