我要投稿

Memori：让 AI 拥有 "持久记忆" 的开源RAG引擎

发布日期：2025-11-17 17:21:11 浏览次数： 1528

作者：趣谈AI

微信搜一搜，关注“趣谈AI”

👆关注趣谈AI，后台回复“源码”获取源码实战

作者简介：
徐小夕，曾任职多家上市公司，多年架构经验，打造过上亿用户规模的产品，聚集于AI应用的实践落地。

最近推出了《架构师精选》专栏，会分享一线企业AI应用实践，并和大家拆解可视化搭建平台，AI产品，办公协同软件的源码实现。

之前和大家分享了我们的 pxcharts 多维表格编辑器和flowmixAI智能办公工作台：

flowmixAI：从 AI 知识库到企业级智能工作台

pxcharts多维表格ultra版：AI + 多维表，工作效率飙升！

JitWord，一款AI驱动的协同Word文档编辑器

最近发现了一个能解决 AI 开发核心痛点的工具 ——Memori。这个被称为 "AI 第二大脑" 的开源项目，正在用一种巧妙的方式解决 LLM 对话中 "记不住事" 的经典问题。

今天我们就来深度拆解这个项目，看看它到底有什么过人之处。

github地址：https://github.com/GibsonAI/memori

star数：3.1k

它到底解决什么痛点？

做 RAG 的朋友都知道：

向量数据库只存“外部知识”，对话一关就“失忆”；
提示词长度有限，历史记录一多就“断片”；
多租户场景下，用户隐私数据混在 prompt 里，极易泄露。

memori 把“会话级记忆”抽象成独立层，让大模型在每次请求时自动携带“相关往事”，既省 token 又合规。一句话：给 LLM 装上“私人日记本”，且日记本归用户自己保管。

它就像给 AI 装了一个 "外接大脑"，用标准 SQL 数据库（SQLite/PostgreSQL 等）存储记忆，让 LLM 能跨会话记住关键信息，还能智能提取有用内容 —— 比如用户说 "我是 Python 开发者"，它会自动归类为 "技能"，后续对话时自动调出来。

功能亮点

在研究了这款项目之后，我总结一下它的几个亮点，供大家参考：

会话持久化：自动分段、去重、加密落盘。
零配置召回：基于 Hybrid Retrieval（向量 + 关键词 + 时间衰减），Top-K 自动可插。
多租户隔离：Namespace + 端到端 AES， SaaS 直接抄作业。
生命周期管理：支持 TTL、手动遗忘、GDPR 一键导出。
边缘部署：50 MB 内存即可跑，树莓派当“记忆盒子”。

技术架构：它是如何实现 "记忆" 的？

理解 Memori 的架构，关键要抓住 "拦截 - 处理 - 存储" 这个核心流程。下面我总结了一个它的架构总览图：

┌-------------------------┐│  Chat App / Agent       │  <-- 任何 HTTP/gRPC 客户端└-----------┬-------------┘            │JWT/API Key┌-----------┴-------------┐│  memori-server (TS)     │  <-- 无状态，可横向扩│  ├─ REST / WebSocket    ││  ├─ ACL 中间件          ││  └─ 记忆调度器          │└-----------┬-------------┘            │gRPC┌-----------┴-------------┐│  memori-core (Python)   │  <-- 有状态，负责召回 & 写入│  ├─ Embedding Router    │  （支持 Ollama / OpenAI / Claude）│  ├─ Recall Service      │  （Hybrid Retrieval）│  ├─ Memory Store        │  （SQLite / PG / S3 插件）│  └─ Crypto Layer        │  （AES-256-GCM，key 不归服务器）└-----------┬-------------┘            │FFI┌-----------┴-------------┐│  memori-lite (Rust)     │  <-- 边缘侧，50 MB 内存│  嵌入式向量索引         │└-------------------------┘

我们可以把它拆成三个层面来看：

调用前（Context Injection）
当我们调用client.chat.completions.create()时，Memori 会先拦截请求，通过 Retrieval Agent（自动模式）或 Conscious Agent（手动模式）从数据库拉取相关记忆，悄悄塞到对话上下文里。
调用后（Recording）
LLM 返回响应后，Memory Agent 会自动提取关键信息（比如 "用户用 FastAPI"），分类后存入 SQL 数据库，并建立全文搜索索引。
后台优化
每 6 小时，Conscious Agent 会自动分析记忆，把重要内容从 "长期存储" 提到 "短期缓存"，确保关键信息优先被调用。

模块组成（代码级拆解）

从项目结构看，Memori 采用了高度模块化的设计：

memori/├── core/           # 核心模块：记忆接口、数据库管理│   ├── memory.py   # 主类，控制双记忆模式│   ├── database.py # 数据库连接和操作├── agents/         # 智能处理代理│   ├── memory_agent.py      # 提取和分类记忆│   ├── conscious_agent.py   # 后台分析和优化│   └── retrieval_agent.py   # 记忆检索引擎├── integrations/   # LLM适配器：OpenAI/Anthropic等├── database/       # 多数据库支持：连接和迁移工具└── tools/          # 记忆搜索工具，支持函数调用

这种设计的好处很明显：想加新数据库？改 database 模块；想支持新 LLM？加个 integration 适配器就行，核心逻辑不用动。

双记忆模式（灵活适配场景）

Memori 支持两种记忆模式，这点我认为特别贴心：

auto_ingest（自动模式）
全自动处理，适合快速上手，不用手动干预
conscious_ingest（手动模式）
可自定义记忆规则，适合复杂场景（比如需要筛选敏感信息时）

核心技术栈清单

我总结了一下Memori 采用的技术方案，大家可以参考一下：

层级	选型	学完可跳槽的公司（emoji 暗示）
前端UI层	React + Tailwind	🍏（苹果风格）
API 框架	NestJS	🛒（蓝色购物车）
召回引擎	Qdrant / SQLite-VSS	🦀（Rust 螃蟹）
Embedding	OpenAI, Ollama, Claude	⛽（AI 加油站）
加密	libsodium + AES-GCM	🔒（安全锁）
边缘索引	Rust + HNSW	🚢（巨轮）
部署	Docker + Helm	☁️（一朵云）

应用场景：哪些地方能用上它？

Memori 的适用范围比我想象的更广，举几个典型场景：

个人助手类应用
记住用户的作息、偏好（比如 "我不吃辣"），提供个性化服务
开发者工具
像例子里的 "FastAPI 项目助手"，记住项目细节，不用反复说明需求
客服 AI
记住用户历史问题和解决方案，避免重复沟通
多 Agent 系统
让多个 AI 角色共享记忆库，协同完成任务（比如一个做调研，一个写报告）
教育类 AI
记住学生的知识盲点，针对性辅导

AI 伴侣

连续聊天 30 天不重复劝睡
法律助手

案件材料按小时增量更新，律师随时追问“上次提到第 3 条证据在哪”。

官方 demo 里的 "个人日记助手" 特别有意思，它能分析用户的情绪变化和生活规律，提供个性化建议 —— 这就是记忆能力带来的进阶体验。

优缺点总结

优点	缺点
记忆层即插即用，半小时上线	中文分词效果依赖外部 tokenizer
加密默认开启，GDPR 合规	边缘版不支持实时多节点同步
边缘 50 MB 内存即可跑	文档示例偏少，社区踩坑贴不多

本地部署教程

想亲手试试？3 分钟就能跑起来：

安装依赖

pip install memorisdk# 如需PostgreSQL，额外安装：pip install psycopg2-binary

配置环境变量
创建.env文件，填入 LLM 密钥（以 OpenAI 为例）：

OPENAI_API_KEY=sk-你的密钥

编写测试代码
创建test_memori.py：

from memori import Memorifrom openai import OpenAI# 初始化记忆系统memori = Memori(conscious_ingest=True)memori.enable()# 初始化OpenAI客户端client = OpenAI()# 第一次对话：告诉AI你的信息client.chat.completions.create(    model="gpt-4o-mini",    messages=[{"role": "user", "content": "我在用Django开发博客"}])# 第二次对话：测试记忆效果response = client.chat.completions.create(    model="gpt-4o-mini",    messages=[{"role": "user", "content": "怎么给我的项目加评论功能？"}])print(response.choices[0].message.content)# 此时AI会自动关联"Django博客"的上下文，给出针对性建议