我要投稿

别再硬扛原生记忆了！OpenClaw内置Mem0，让Agent更省token、更智能

发布日期：2026-03-04 17:22:49 浏览次数： 4268

作者：字节跳动技术团队

微信搜一搜，关注“字节跳动技术团队”

一、引言

众所周知，OpenClaw的强大在于其灵活的Skills生态和高效的大模型决策能力，作为个人智能助手，它可以在轻松在个人电脑上部署，并且接入飞书等常用聊天工具，实现方便的智能体验。

不过，OpenClaw内置的默认记忆插件仅基于文件记录操作，虽然能快速接入记忆能力，但会无差别的、事无巨细地保存所有的操作记录，不仅造成token消耗过多，增加开发成本，还存记忆不筛选、没有重点等多个问题，实则“反向拖后腿”，因此原生记忆系统也成了OpenClaw的一大“硬伤”。

与其在原生记忆插件的坑里反复调试、不如直接重构OpenClaw的记忆体系，openclaw-mem0-plugin插件应运而生，该插件将记忆接入mem0，实现记忆的精确检索，减少token的消耗；同时，在会话中自动捕捉关键的记忆信息；基于mem0云服务平台实现记忆跨会话，跨Agent的管理。插件安装过程简单快捷，只需获取API Key和接入地址，并安装配置插件即可使用。

本文将介绍OpenClaw原生记忆系统的实现原理，手把手带你安装、体验openclaw-mem0-plugin插件，从而为OpenClaw用户的记忆能力提供一个企业级的选择。

二、OpenClaw 记忆系统实现原理

1.1 为什么需要“记忆层”

传统基于 LLM 的 Agent，每个请求都是“无状态”的：上下文只存在于当前 prompt 中，一旦会话结束或上下文被压缩，就再也找不回之前的细节。OpenClaw 的目标是让个人或团队可以长期运行“自己的智能体”，因此必须提供一个跨会话、可编辑、可回溯的记忆层，而不是把一切都塞进对话窗口里。

OpenClaw 的设计选择是：把记忆当成工作区里的普通文件，所有持久记忆都写进 Markdown，再通过本地索引和检索把“该记住的”片段重新喂回 LLM，而不是强依赖外部云服务或复杂的向量数据库集群。

1.2 文件优先与本地优先的记忆架构

OpenClaw 把记忆分成“文件层”和“索引层”两部分：文件层用 Markdown 组织知识与经验，索引层用 SQLite + FTS5 + 向量扩展做检索，是一个典型的 file‑first、本地优先 架构。

文件是真实来源（source of truth）：只要你能在编辑器里看到的 Markdown，就一定是模型有机会“记住”的内容；反过来，模型不会悄悄把东西塞进某个看不到的数据库里。
本地优先：默认只依赖本地文件系统和 SQLite；向量检索通过 sqlite-vec 这种库嵌入到 SQLite 中完成。一方面降低部署门槛，另一方面也便于把工作区整体纳入 Git 做版本管理和备份。

1.3 记忆文件的层次：长期、短期与会话

在文件层，OpenClaw 主要有三类与记忆相关的内容：

长期精选记忆 MEMORY.md
用来存放相对稳定的事实，比如：你的名字、技术偏好、常驻项目、重要决策、常用服务地址等。通常由 Agent 或你自己手动维护，内容量不会太大，但质量要求高。
每日日志 memory/YYYY-MM-DD.md
每天自动或半自动追加的工作日志，记录当天的操作、临时决策、踩坑过程、TODO 等，更像“工作记忆”。新的会话启动时，会优先读取最近一两天的日志，为当日工作提供上下文。
会话日志 sessions/*.jsonl

以 JSONL 形式记录完整的对话树（用户消息、工具调用、压缩摘要等），供索引层选择性纳入检索。相当于“原始事件流”，可以被二次加工为更结构化的记忆。

通过配置可以选择是否把 sessions 也加入 memory 索引，从而在“稳定长期记忆”和“带噪声的完整对话历史”之间做权衡。

1.4 索引与混合检索：SQLite + 向量搜索

在索引层，OpenClaw 内置了一个 Memory Search 子系统，默认使用 SQLite 作为底层存储：

Markdown 分块与嵌入

按行把 Markdown 切成大小约 400 tokens、重叠约 80 tokens 的块，尽量保证语义完整不被截断。
为每个块计算哈希并缓存嵌入，避免重复计算。
嵌入可以来自本地 GGUF 模型（通过 node-llama-cpp）、OpenAI text-embedding-3-small 或 Gemini 等，支持 batch 与失败重试策略。

文本检索（BM25）
借助 SQLite 的 FTS5 虚拟表，对 chunk 文本做全文索引，适合搜索错误码、变量名、路径等“不能被 embedding 吃掉”的硬 token。
向量检索
若环境安装了 sqlite-vec，会在 SQLite 内建一个向量虚拟表，按向量相似度找出与查询最接近的若干块，用于语义级别的“相似记忆”。
混合排序
默认启用混合检索：向量分数和 BM25 分数按可配置权重混合，既能找出语义上类似的片段，又不丢失对精确关键词的敏感度。

整体来看，它是一个“单机版 RAG 引擎”，但专门针对 Markdown 工作区做了工程优化，非常适合个人或单机 Agent 的长期记忆场景。

1.5 与 Agent / 工具链的集成

在 Agent 侧，OpenClaw 把记忆暴露为工具，最典型的是：

memory_search：给定自然语言查询，在 MEMORY.md、memory/*.md（以及可选的 sessions）里检索相关片段，并把结果作为一个结构化对象返回。系统提示会明确告诉模型：凡是涉及历史决策、长期偏好或之前提到过的信息，回答前应先调用这个工具。
memory_get：按路径和行号精确读取某段 Markdown 内容，帮模型做“按需展开”，避免一次性把整篇长文塞进上下文。

此外，OpenClaw 还引入了类似“预压缩记忆冲刷”的机制：当会话上下文接近模型的 context 上限时，会静默触发一个内部 turn，请模型把当下对话中真正重要、值得长期保留的事实写入当天的 memory/YYYY-MM-DD.md，以降低后续上下文被裁剪时的信息损失。

1.6 记忆后端插件化与 LanceDB 插件

虽然内置的文件 + SQLite 方案已经足够好用，但 OpenClaw 仍然为记忆后端预留了插件 Slot。默认情况下，memory_search 工具由核心插件 memory-core 提供，也可以通过配置切换到其他后端。

近期官方示例中，重点介绍了一个 LanceDB 驱动的第三方插件 memory-lancedb：它把记忆存储在 LanceDB 中，提供更丰富的多模态和向量检索能力，并在工具层暴露 memory_recall、memory_store、memory_forget 等接口，用以演示“把记忆完全外置”的可能性。

openclaw-mem0-plugin 正是沿着同一条思路，把底层记忆后端替换为 Mem0，而不改变上层 Agent 的工作方式。

三、openclaw-mem0-plugin 插件：为 OpenClaw 引入 Mem0 长期记忆

2.1 Mem0 简介与集成思路

Mem0 是一个聚焦“LLM 长期记忆”的开源/云端服务，它在 LLM 之上增加了一个专门的记忆层：负责从对话中抽取结构化事实、做去重与合并、存入向量库，并在每轮对话前根据当前 query 做自动召回。

openclaw-mem0-plugin 插件的目标，就是把 Mem0 变成 OpenClaw 的一个记忆后端：

对上：以 OpenClaw 插件的形式，接入 Agent 生命周期，在每轮对话前后做自动召回（auto-recall）和自动记录（auto-capture）。
对下：把所有持久记忆存储在 Mem0 后端（云端或自托管），不再依赖本地 SQLite；对于 OpenClaw 来说，记忆就像一个独立的服务，可以跨会话、跨进程、甚至跨多台机器共享。

2.2 安装方式

openclaw-mem0-plugin 以 OpenClaw 插件的形式发布，安装流程与其他插件类似。核心步骤如下：

确保OpenClaw 已安装
本地至少需要能正常运行 Gateway 和一个 Agent，例如通过 openclaw status 确认环境正常。
安装插件包

openclaw plugins install @xray2016/openclaw-mem0-plugin

该命令会从 npm registry 安装插件，并在本地插件目录（通常位于 ~/.openclaw/plugins）下注册。

当前插件仓库为临时仓库，后续请参考火山引擎官网文档安装插件。

准备 Mem0 侧配置

如果使用 Mem0 Cloud，需要在 Mem0 控制台创建项目，获取 API Key，并记录云端地址。详细步骤参考（https://www.volcengine.com/docs/86722/1884417?lang=zh），其中创建project时推荐填入如下的prompt，引导mem0提取个人的姓名/职业等基本信息，也可以根据用户的场景自定义。

你是一个用户基础信息的提取专家，要求从一段对话中提取用户的基本信息(包括姓名、年龄、性别、地域等)，并按照指定格式返回比如：```AI: 你好呀～最近过得怎么样？用户: 还行吧，我叫王小明，最近工作有点忙。AI: 你好，小明！😊 你是做什么工作的呀？用户: 我在互联网公司做后端开发，今年 28 岁了。AI: 哇，程序员呀～那肯定经常加班吧？用户: 哈哈，是的，尤其在北京，竞争挺激烈的```输出：{"facts":["年龄:28岁","姓名:王小明","职业:程序员","地域:北京"]}

修改 OpenClaw 配置启用插件
在 ~/.openclaw/openclaw.json 或对应 Agent 的配置文件中，为插件增加一个 entry，配置好模式和参数（见下文）。

2.3 插件配置示例

平台模式是最简单的接入方式——把所有记忆存储和检索的工作交给 Mem0 云端：

// ~/.openclaw/openclaw.json 片段{  "plugins": {    "entries": {      "openclaw-mem0-plugin": {        "enabled": true,        "config": {          "mode": "platform",          // 使用 Mem0 Cloud          "apiKey": "your_api_key", // 从 Mem0 控制台获取          "userId": "openclaw-user",   // 用于区分不同终端用户          "host": "mem0_platform_addr"  // mem0服务地址        }      }    }  }}

常见的配置建议：

userId 由用户自定义，保证不同使用者之间的记忆隔离。
host/api_key 可从mem0控制台获取。

配置完成后，重启 Gateway 即可让 Agent 拥有跨会话的 Mem0 长期记忆能力。

openclaw gateway restart

2.5 记忆插件验证

新开一个session，模拟输入带有很强用户信息的对话，验证OpenClaw是否触发记忆存储。

我叫林晓，28岁，是个性格开朗的女生，热爱生活，喜欢探索新鲜事物。平时工作认真，闲暇时爱旅行、摄影、阅读，也享受和朋友分享美食、聊天。新的一年，希望能继续努力，收获更多成长和快乐！

等一会如果看"memory store completed"则表示OpenClaw触发添加记忆成功。

打开火山mem0的控制台，通过长期记忆检索即可看到记忆已经生成。提取别的记忆，修改记忆项目中策略的prompt即可。

2.6 Agent 内的 API 与命令行体验

openclaw-mem0-plugin 向 Agent 暴露了一组用于“显式管理记忆”的工具，同时也扩展了 CLI 以便开发者调试。

1. 工具层接口（面向 Agent）

典型的工具包括：

memory_search：按自然语言查询相关记忆，支持指定 scope（如 "session"、"long-term" 或 "all"）。
memory_list：列出当前用户的所有记忆，常用于调试或审查。
memory_store：显式写入一条记忆，通常在用户说“牢记这件事”时由模型调用，可选择写入长期或仅当前会话。
memory_get：按 id 精确读取某条记忆，用于进一步展开上下文。
memory_forget：删除某条记忆，用于满足用户“不要再记住某件事”的需求。

这些工具会出现在 Agent 的工具列表中，模型可以像使用 memory_search 那样，在需要时主动调用它们。

命令行体验（面向开发者）

为了方便验证 Mem0 是否正常工作，插件还提供了一些 CLI 命令，例如：

# 搜索所有 scope 下的记忆openclaw mem0 search "what languages does the user know"
# 只查长期记忆openclaw mem0 search "what languages does the user know" --scope long-term
# 只查当前会话记忆openclaw mem0 search "what languages does the user know" --scope session
# 查看当前用户记忆统计openclaw mem0 stats