免费POC, 零成本试错
AI知识库

53AI知识库

学习大模型的前沿技术与行业应用场景


我要投稿

Clawdbot 深度拆解: 7 个问题看懂它。

发布日期:2026-01-29 09:02:23 浏览次数: 1596
作者:AI大模型应用实践

微信搜一搜,关注“AI大模型应用实践”

推荐语

开源AI助手Clawdbot引爆开发者圈,这款"全天候Jarvis"如何重新定义个人智能体?

核心内容:
1. Clawdbot的核心定位与三大关键特性
2. 与Manus/Cowork的对比分析及独特优势
3. 安装配置指南与底层运行机制解析

杨芳贤
53AI创始人/腾讯云(TVP)最具价值专家

点击上方蓝字加入我们

这两天AI技术圈的焦点被一个名为 Clawdbot(已改名为Moltbot) 的开源项目牢牢占据。
这个被称为“全天候 Jarvis”的AI助手,不仅在 GitHub 上的星标数在短时间内飙升8万+,甚至引发了一种名为“FOMO”(错失恐惧症)的开发者狂欢,连带苹果 Mac mini 都因其作为部署主机而销量大增。
连 Claude 的母公司 Anthropic 都有员工评价:“这正是我们设想中 Claude Cowork(协同工作)应有的形态。”
今天带大家来深度认识和体验下这位当红炸子鸡:Clawdbot
  1. 快速弄懂:Clawdbot 是什么?
  2. 印象派:更像 Manus 还是 Cowork?
  3. Clawdbot 的独特“魅力”在哪里?
  4. Clawdbot 有哪些“创意”使用场景?
  5. 如何安装与配置 Clawdbot?
  6. 揭开引擎盖:Clawdbot 是如何运转的?
  7. 观察与展望:有哪些不足与挑战?


1

快速弄懂:Clawdbot 是什么?

简单说,Clawdbot 就是:
一个开源免费、本地运行的个人 AI 智能体(Agent)。
  • 开源免费:完全开源免费!甚至还是极为宽松的MIT License(当然模型得自己准备,API 费用还要自己出)。
  • 本地运行:这不仅是因为它可以本地部署,而是在设计上就是以“住在”你的电脑里为主要场景。
  • 个人智能体:面向个人工作的智能体。注意是“ Agent ”,不是“ Chatbot ”(豆包),不是“ Copilot ”(Office Copilot)。

由于“智能体”概念的滥用,必须再次认识,如何才算真正的Agent?抛开复杂的ReAct、Skills 等概念,普通人可以这么去判断:

  • 会规划:把任务目标拆分成多个步骤

  • 会用工具执行动作:调用API、运行脚本、操作浏览器等

  • 自我检查与迭代:失败重试、验证结果、对齐任务目标等



2

印象派:更像 Manus 还是 Cowork?

说到通用智能体,你一定会想到两个典型的代表 — 去年大火的Manus与Anthropic最近的Cowork。它们代表了两种不同的 Agent 形式:
  • Manus:云端远程型
工作方式是:给Agent一台“远程电脑”(沙箱),它在云端点网页、调工具、跑脚本,最后产出文本或文件。
适合:在线订票、表格填写、信息搜集整理、跨网站流程等
  • Cowork:本地协作型
工作方式:把自己的电脑“共享”给它,设定一个“工作区”。它在一定的权限控制与人类监督下完成工作任务。
适合:写作、整理资料、批量处理文件、工作任务处理等
那么Clawdbot是怎样的呢?
从形态上看,Clawdbot 的确更接近 Cowork,而非 Manus — 属于“本地优先 + 外部/本地模型 + 本地资源访问“的路线。
尽管如此,Clawdbot 又有着诸多的独特之处。


3

Clawdbot 的独特“魅力”在哪里?

如果只是一个开源版本的Cowork,那么有OpenCowork,有Eigent;而不会是Clawdbot火爆出圈。
我们把Clawdbot的独有“魅力”总结到以下五个方面
  • 入口形态
Clawdbot的入口不限定在某个官方工作台(比如Claude Desktop),而是在你日常使用的工作聊天入口,比如WhatsApp/Telegram/Discord/iMessage/飞书/钉钉等 — 如果你愿意,甚至可以通过 Email 让它干活。
  • 主动性
Clawdbot可以根据你的预设条件(比如定时)或者数据变化主动联系你。例如,每天早晨发送简报、待办事项提醒,或者在监测到某项数据异常时第一时间启动Agent并发消息告知。这让交互体验从“工具”变成了真正的“协作”。
  • 长期记忆能力
Clawdbot内置了完善的长期记忆机制。会自动总结每次对话的关键信息并存入长期记忆库。或许几周前你随口提到的细节,它在今天的对话中依然能调用。你甚至可以调整其检索机制 — 比如向量与关键词检索的权重比。
  • 高可扩展性
这是我认为它最强大的地方。
Clawdbot 采用核心精简、边缘丰富的插件化架构。消息渠道(Channels)、工具(Tools)、技能(Skills)、自动化钩子(Hooks)、模型(Providers)、命令行(CLI)均可通过插件等方式扩展,并遵循零侵入、热更新、安装简单。你甚至可以让它自行编写插件,自行安装,扩展自己的能力!
除了软件模块扩展,Clawdbot一个强大甚至“有趣”的功能在于:可以把多个电脑或手机设备变成Clawdbot的能力节点(Nodes),用来扩展摄像头、屏幕录制、地理位置、交互式UI等额外能力。
  • 高权限边界
这是 Clawdbot 强大也最备受争议的地方。相对Cowork的以“指定工作区/文件夹授权”控制访问边界,Clawdbot则被赋予了更高的操作电脑的权限。它能执行 Shell 命令、读写文件、运行脚本、控制浏览器,调用第三方 API、甚至控制你家里的设备。所以也引起权限太高的争议与风险。
除此之外,我们把Clawdbot与Cowork、Manus做个简单对比:


4

Clawdbot 有哪些“创意”使用场景?

我们用一些社区案例来了解来自 Clawdbot 的独有“创意”。

  • 收件箱清理(Gmail 插件)
用户在 Telegram 下达指令,让它检查最近 10 封邮件并判断哪些需要回复。Clawdbot 会调用 Gmail 插件扫描邮件列表做筛选,并给出判断理由。
  • 会议日程安排( Calendar API)
会议协调:输入“下周找一个 30 分钟空档与某人开会”。Clawdbot 会读取日历空闲时间,必要时对齐对方可用时段,给出多个候选时间并发出邀请。
  • 日程提醒(定时任务 + 聊天渠道)
把它当成自动化主动“秘书”,例如:“每天早上 9 点整理每日早报给我”。Clawdbot 会创建定时任务,到点后通过聊天渠道准时推送。
  • 设备控制(本地状态 + IoT API)
例如要求它“晚上 11 点后如果电脑仍在使用,就把客厅灯光调暗”。Clawdbot会定时触发检查本机活动状态,再调用灯光控制 API 完成动作。
  • 更高阶的自主应变
一个社区分享的较“科幻”的案例是:用户让它预订周六晚餐餐厅。在线订位失败后,它转而使用语音生成服务模拟电话语音联系餐厅,最终完成预约!
整体而言,这些场景的确在很大程度上实现了许多我们曾希望 AI 去做的繁杂工作。以前头疼的一些日常任务,现在只用在聊天界面上吩咐一句就搞定。


5

如何安装与配置 Clawdbot?

多说无益,我们在MacOS下做一个简单的体验。Clawdbot 配置项目非常多;不过目前教程已经满天飞,这里就简化一些。
配置Clawdbot有一个小小的诀窍是:
先做最小配置,然后让 Clawdbot 来辅助你配置。
第一步:安装。
最快的方法是从终端工具执行命令:
curl -fsSL https://clawd.bot/install.sh | bash
安装脚本会自动检测操作系统并完成安装。

第二步:配置Gateway。
运行命令开始配置向导:
clawdbot onboard --install-daemon
在确认安全提醒后,选择“QuickStart”,这样会跳过很多自定义配置(采用默认),最开始你只需要配置Model(这里选择了MiniMax)、默认 Skills,其他都可以暂时跳过(选择“Skip”)。直到看到 Gateway 启动成功(先忽略什么是Gateway)。最后会提示:
选择Open the Web UI,将会打开浏览器,用来管理与配置Clawdbot。
现在,就完成了基本安装与配置。
在WebUI中提供了Chat的对话工具,先打个招呼测试下模型吧。

第三步:配置Channel。
如果你只想用WebUI上的Chat来简单体验Agent,那么就已经结束了。
但将入口扩展到第三方IM工具,正是 Clawdbot 的独到之处,如果想体验,你就需要配置 Channel(相当于IM适配器)。
由于默认支持的 Channel 对国内用户并不适合。因此这里我选择使用插件来将飞书应用接入到本地的Clawdbot。
我试着让 AI 帮我配置:
它居然成功了!AI选择了一个feishu-bridge的技能安装,并指导我完成了飞书平台上的配置,且最终启动正常(你也可以选择其他插件)。
现在,通过飞书客户端给机器人发送一个消息,就可以“激活”Clawdbot:

第四步:简单体验。
现在可以通过飞书来给机器人安排工作了,你也可以拉到工作群里共享(小心Token爆炸)。
做了几个测试看看效果:
由于目前Mac App,以及用于能力扩展的iOS/Android Node客户端都需要源码编译,另外 API 也需要时间配置,希望下次可以分享更多复杂的案例。
尽管如此,现在借助 Clawdhub 上海量的Skills,已经有大量的场景等你去挖掘与实践,最重要的是 — 你不用和 AI 抢一台电脑,而可以远程吩咐家里的“助手”随时帮你干活。


6

揭开引擎盖:Clawdbot 是如何运转的?

了解 Clawdbot 能做什么后,我们来看它背后的原理与设计。
Clawdbot 本身的架构是比较复杂的,涉及较多的层次与模块,加上偏”分布式“的设计以及扩展性、安全性的众多考虑,已经远远超出一个普通 Agent 的范畴。
当然,即使对于开发者,大部分也无需过度关注内部细节。本文我们首先来认识Clawdbot 架构设计的“一级视图”:
这里用尽可能容易理解的方式介绍核心模块:
Gateway/Routers(中央网关)
“大脑中枢+交通枢纽”,也是整个系统的核心。
默认运行在本地的 127.0.0.1:18789 端口。它负责管理会话、调度Agent任务、维持与各个聊天渠道的消息连接、管理配对设备与权限、协调其他Nodes能力等。几乎所有的用户消息与控制命令都需要从这里经过。

Agent(智能体)
“任务执行者”,也就是实际干活的主体。
Agent在接收到消息与任务后,动用自己的脑袋(LLM/大模型)、手脚(Tools)、专业知识(Skills),尽可能的完成任务,其中可能会访问Web、运行命令、读写文件、编写代码,调用其他Nodes能力(比如摄像头)。
Clawdbot支持多Agent模式,可以互不干扰,或者相互协作。
每个Agent有自己的工作区,也就是自己的“办公桌”,放置专属配置与产物。

Nodes(远程能力节点)
“分布式触手”,与运行Gateway的主机协作的设备。
Nodes 就是在主机之外的其他“能力”节点。你的旧手机、闲置电脑都可以作为 Node 加入网络,以提供更多的能力,比如摄像头、屏幕录制、系统控制、屏幕共享、显示可交互式的“富”界面等。Nodes 需要在远程设备上运行相应的Node 客户端 App。
借助 Nodes,你可以要求Agent:
  • 调用某个 iPhone 的摄像头拍照,然后做后续处理
  • 搜集服务器的数据,生成仪表盘界面(A2UI描述),然后推送到你的 iPad 上做展示(WhatsApp 等消息客户端无法支持复杂UI)

Channels(渠道适配器)
“通信与翻译官”,与不同消息渠道的通信与消息适配。
根据配置与不同的渠道(比如飞书)建立安全链接,完成消息收发(通常是WebSocket 协议)以及格式转换 — 即翻译成 Clawdbot 能听懂的格式。

Clients(客户端)
“管理与控制者”,用来给 Gateway 下达“指令”。
Clawdbot 提供了多种形式的管理 UI,其功能类似,但使用形式不同。如果你喜爱命令行,使用clawdbot CLI 最方便;如果想可视化,可以用 Web UI;此外Mac用户还有一个常驻菜单栏的“管家”。
除了以上的核心组件与机制之外,Clawdbot的Plugins机制、基于事件的Hooks、多智能体协作、长期记忆机制、分层安全机制等设计,我们将在后续做更深入的探讨与演示。


7

观察与展望:有哪些不足与挑战?

尽管 Clawdbot 在设计、功能与体验上,有着耳目一新的独到之处,我们也看到AI 越来越从单纯的“对话者”进化为“行动者”。不过作为一款实验性质的开源软件,仍然有一些挑战需要面对。
安全风险
尽管Clawdbot在诸多层面有大量的安全机制,但GitHub 上关于安全的 Issue 还有几百个。毕竟,高自由度与高风险一般不分家 — 赋予 AI 读写文件和执行 Shell 的权限极其危险。一旦遭遇“提示词注入攻击”,AI 可能会被诱导执行删除等破坏性指令。

建议:正式使用切勿在存有敏感数据的主力机上裸跑,最好使用 Docker 容器或独立设备隔离运行。


成本与不稳定性
在测试时发现 Clawdbot 对 Token 的消耗相当大。当然也可能是优化不够,不过高强度的 Agent 必然消耗大量的 Token。如果再挂载 Claude/Gemini Pro这类昂贵的模型,API 费用不容小觑(但任务质量又的确重度依赖模型)。同时,测试时也发现Agent 偶尔会卡死或崩溃,需要人工介入。

本土化挑战
目前 Clawdbot 主要适配海外生态(Telegram/WhatsApp/Slack),缺乏对微信、飞书、钉钉等国内主流 IM 的官方支持,限制了其在国内日常场景的实用性;尽管已经有一些插件,不过考虑到一些平台的封闭性,未来实现到什么程度仍然有待观察。
虽然如此,Clawdbot 依然是一个里程碑。它很大程度展示了未来工作生活的新可能:我们负责决策与创造,AI 负责执行与琐事 这场由开源社区发起的 AI 智能体的新故事,或许才刚刚开始。

喜欢就关注
Image
动动小手点个
Image
在看最好看
Image
加入公众号交流群(说明来意
图片

53AI,企业落地大模型首选服务商

产品:场景落地咨询+大模型应用平台+行业解决方案

承诺:免费POC验证,效果达标后再合作。零风险落地应用大模型,已交付160+中大型企业

联系我们

售前咨询
186 6662 7370
预约演示
185 8882 0121

微信扫码

添加专属顾问

回到顶部

加载中...

扫码咨询