微信扫码
添加专属顾问
我要投稿
为AI Agent打造类人脑的三层记忆架构,实现从简单记录到深度认知的跨越。 核心内容: 1. 个体基础记忆层:保真存储原始信息,构建专属资料库 2. 深度洞察记忆层:动态连接信息点,形成带时间戳的知识网络 3. 集体经验记忆层:跨域共享解决方案,实现经验动态进化
今天我们进一步谈谈,如何为AI Agent设计一个结构化的记忆系统。一个像人脑那样既有分类分层记忆、不仅能“记录”,更能“理解”、“反思”和“借鉴”的认知架构。
最近正好读了三篇相关的技术论文,觉得很有意思:
第一篇是 MIRIX AI 团队的《MIRIX: Multi-Agent Memory System for LLM-Based Agents》,他们模仿人脑,设计了六个不同的“记忆组件”和一个管理团队,让 AI 能长期、多样地记住你的信息,还有点初步的总结能力。
第二篇是 Zep AI 团队的《ZEP: A TEMPORAL KNOWLEDGE GRAPH ARCHITECTURE FOR AGENT MEMORY》,他们搞了个带时间戳的知识图谱,让 Agent 的记忆不再是静止的,而是能跟着时间动态变化。
第三篇是耶鲁、OPPO 这些团队一起写的《AGENT KB: Leveraging Cross-Domain Experience for Agentic Problem Solving》,他们想让 AI 像个专家一样,能“借鉴经验”,解决一个问题后,下次遇到类似的就知道怎么抄近路了。更牛的是经验的跨域共享和动态进化,我把它归结为“经验工程”。
所以,我试着把这三篇论文里最精华的想法给串起来,攒成了一个三层记忆的认知架构。目的就是想给 AI Agent 装上一个真正好用的大脑,不仅让它能“记住”,还能让它慢慢形成“自我认知”,讲出有深度的故事,最后还能用上所有人的智慧。
这个三层记忆架构,每一层干的活儿都不一样,但它们得配合起来才行。
第一层:个体基础记忆层,只属于你的资料库
第二层:深度洞察记忆层,把零散信息连起来
第三层:集体经验记忆层,大家的经验教训
这三层不是简单地堆叠在一起。资料库提供的是“食材”(原始信息),深度洞察层把“食材”做成“美味佳肴”(你的专属洞察),而经验库则提供了全世界的“高级菜谱”(最佳策略),告诉 AI 怎么才能做得又快又好。
下面,我们就一层一层拆开来看看。
这层的设计思路就是从 MIRIX 论文里来的,核心就是模仿人脑,给不同类型的记忆分不同的区。它不是一个乱糟糟的硬盘,而是一个由好几个专业的“记忆盒子”和一队“管理员”组成的系统。
这层的核心是六个设计好的记忆盒子,每个盒子只存一种特定的信息,这样找起来就快,也不会乱。而且这些盒子本身就带有一些结构,所以第一层自己就有了一点智能。
1. 核心记忆 - 关于“你”和“我”的基本设定
名字
: '小旅', 角色
: '你的旅行规划师', 性格
: ['贴心', '懂得多'], 目标
: '帮你规划完美的旅行'}"。这是它一切行动的出发点。用户名
: '李明', 职业
: '建筑设计师', 习惯
: {'座位': '靠窗', '酒店风格': '精品设计酒店'}, 过敏源
: ['花生']}"。旅行风格
: '喜欢深度游,避开游客'”。这样核心记忆就很精炼。2. 情景记忆 - 带时间戳的“发生过的事”
事件
: '用户提问', 时间
: '2025-07-15 15:02', 谁
: '李明', 大概内容
: '问去京都看枫叶的最佳时间', 细节
: {'提到地点': ['岚山', '清水寺']}, 推测心情
: '很期待',详细日志
: '......' }"。3. 语义记忆 - 你个人的“维基百科”
旅行主题
-> 历史文化
-> 去过的地方
-> 罗马
”。点开“罗马”,里面还有更详细的信息:“罗马
: {标签
: ['古迹', '美食'], 最佳季节
: '春秋', 你的评价
: '很喜欢'}"。旅行目的地
-> 南美洲
-> 历史遗迹
”下面,而不是让它孤零零地飘着。4. 程序记忆 - 可以一步步执行的“操作手册”
类型
: '任务流程', 名称
: '标准国际机票预订流程', 步骤
: [{'第1步': '搜索航班', '参数': {'目的地': '...', '日期': '...'}}, {'第2步': '验证用户护照信息', '参数': {}}, ...]}"。5. 资源记忆 - 你给它的文件,都加了索引
文件名
: '我的日本签证申请表.pdf', 类型
: 'pdf', 内容摘要
: '包含个人信息、行程和酒店预订单...', 提取出的信息
: ['护照号 G123456', '东京帝国酒店', ...]}"。6. 知识金库 - 加了密的“保险箱”
类型
: '护照信息', 所有者
: '李明', 加密数据
: 'encrypted(...)', 敏感级别
: '高', 谁能用
: ['李明本人', '订机票那个流程']}"。这六个盒子一起工作,就给 AI 建好了一个关于你的、全面又安全的资料库。
光有盒子还不够,还得有个管理团队来决定东西往哪儿放、怎么取。MIRIX 的设计里就有这么一个团队,由 8 个智能体组成。
这个团队主要干两件事:更新记忆和查找记忆。
当你说句话,或者传张图,这个流程就开始了:
当你问问题时,这个流程就开始了,比更新要更聪明一点:
通过这么一套分工明确的架构,资料库这一层不仅存了信息,还保证了存得有序、找得快,给 AI 打下了一个扎实的记忆基础。
如果说第一层解决了“记住什么”的问题,那这一层就是要解决“理解什么”的问题。这层的想法主要来自 ZEP 论文,他不是重复记录第一层已有的信息,而是在第一层丰富的结构化记忆之上,进行深度的、跨组件的合成、关联与推理。他将那些看似孤立的“记忆碎片”,用因果和时间编织起来,最终形成一张动态的、能看出门道的个人知识网。
这层的核心,是个叫时态知识图谱的东西。我们拆开看:
知识图谱:就是用点(代表人和物)和线(代表关系)来表示知识。比如,“李明”- [喜欢] ->“历史古迹”。这样 AI 就能像人一样,在不同概念间建立联系。在这个图谱中,点之间的连接权重,不仅仅基于直接的逻辑关系,还会受到共现频率、时间邻近性、情感强度(从第一层的情景记忆中推断)等多种因素的影响。
双时态:这是 ZEP 设计最妙的地方。在它的知识图谱里,每一条“线”(关系)都记了两个时间:
事件时间(Valid Time):这件事在现实世界里是什么时候发生的。这样做的好处是,AI 能分清“客观事实”和“它的认知”。
举个例子,你说:“我从2020年就想去冰岛,但今年突然对热带雨林感兴趣了。”
AI 就能很清楚地记录下这个变化。
简单说,就是它不仅知道“是什么”,还知道“从什么时候开始”以及“到什么时候结束”。
再举个例子:
(李明) - [喜欢的旅行主题是] -> (历史古迹)
。(李明) - [喜欢的旅行主题是, 事件时间 从: 2018-01-01, 到: 2023-12-31, 系统时间 从: 2018-01-01, 到: 2023-12-31] -> (历史古迹)
。同时,可能还有另一条:(李明) - [喜欢的旅行主题是, 事件时间 从: 2024-01-01, 到: 现在, 系统时间 从: 2024-01-01, 到: 现在] -> (自然风光)
。就是这两个小小的时间戳,让 AI 明白了 “变化”。它知道你的喜好会变,所以给你的建议也会与时俱进。
这张图谱的“养料”,主要来自第一层资料库里的情景记忆和语义记忆。你可以认为这一层是对第一层核心记忆、情景记忆、语义记忆的连接、反思和深层理解。
这层不会直接存聊天记录,而是有一套流程,把原始信息提炼成结构化的知识。
(我) - [喜欢] -> (潜水)
。(用户) - [偏好] -> (跟团游)
的关系,然后把它标记为“已结束”,再新建一条 (用户) - [偏好] -> (自由行)
的关系。有了这张网,AI 的能力就完全不一样了。
把不同类型的记忆串起来:
以前,核心记忆(个人偏好)、情景记忆(发生过什么事)和语义记忆(这是什么东西)是分开的。但在这层,它们被连起来了。比如,资料库的情景记忆里有“你上周末去了一家土耳其餐厅”,语义记忆里有“土耳其是个历史悠久的国家”。这层就会在知识网里加一条线,把“去餐厅的经历”和“土耳其这个国家”连起来。下次你问“我最近对哪个国家感兴趣?”,它就能从这次吃饭的经历,猜到你可能对土耳其感兴趣。
实现联想(睹物思情和听曲思人):
这是这层最神奇的地方。因为知识是网状的,一些看起来不相关的事也能被串起来。
睹物思情:假设知识网里有这么几条关系:
(你) - [在...度蜜月, 时间: 2019-08-10] -> (圣托里尼岛)
(圣托里尼岛) - [在] -> (希腊)
(你妻子) - [一起度蜜月, 时间: 2019-08-10] -> (圣托里尼岛)
某天你跟 AI 说“我想找个安静的海岛放松一下”,它不只会给你列一堆热门海岛。它会顺着知识网联想到,“希腊海岛”跟你的“蜜月回忆”有关。它可能会很巧妙地回应:“好的。说到安静的海岛,希腊那边不错。比如圣托里尼,那里的日落很美,很多人都在那儿留下了美好回忆。你想重游故地,还是探索些新地方呢?”
听曲思人:再比如,假设你每次和好朋友“Cathy”视频聊天的时候,都喜欢放同一首爵士乐当背景音乐(AI能听到并认出这首歌)。慢慢地,AI 就会在它的知识网里,把“和 Cathy 聊天”这件事,跟“这首爵士乐”这条线给连起来。时间长了,这条连接会变得很强。所以,某天你一个人在家放起这首歌时,即使 Cathy 根本不在,AI 知识网里跟这首歌连着的最强的那个点——“Cathy”——就会被点亮。这时候,AI 也许就会很自然地问一句:“这首曲子让我想起了 Cathy,你们最近还好吗?”
这种能力让 AI 的对话一下就有了人情味。
为了管好这张复杂的知识网,我们专门设了一个深度洞察管理器。它干两件事:
有了这一层,AI 才算真正开始“思考”。它不再是被动地记东西,而是主动地去理解你,洞察你话语背后的深层含义。
一个人再聪明,经验也有限。如果一个 AI 犯过的错,还得让成千上万个别的 AI 再犯一次,那就太浪费了。第三层集体智慧经验库的目标,就是让 AI 能从所有人的智慧里学习,不再单打独斗。
这层的想法主要来自 AGENT KB 论文,他们搞了一套方法,把一次次的具体操作,总结成通用的“方法论”,我把它归纳为“经验工程”,这在《为什么AI Agent会“重复犯错”?治愈失忆的解药是能自我进化的“经验工程”》一文中也有深入探讨。
这个经验库的基础,叫经验单元。它不是简单的聊天记录,而是对一次完整的“解决问题过程”的总结和提炼。
经验单元的产生,就是个从“个例”到“通则”的过程:
每个总结出来的经验单元都遵循一个标准结构,这样才方便查找和使用。
问题模式:描述“这是个什么样的问题”。不是具体的问题,而是对问题类型的概括。比如,“欧洲多国火车旅行规划”、“带小孩长途飞行的方案”。
目标:说明这个问题要达成的最终效果。比如,“生成一张无缝衔接的火车行程表”、“提供一个能订到婴儿摇篮的航班组合”。
解决方案轨迹:这是经验单元的核心,就是总结出来的“方法论”或“操作步骤”。它只说“该干什么”和“为什么这么干”,不涉及具体的代码。比如:
Rail Europe
这种聚合平台规划大概路线。”适用场景:说明这个经验适合什么情况,比如是家庭游还是背包客,是旺季还是淡季。
相关经验:说明这个经验和其他经验的关系,比如“是某个经验的简化版”。
示例,一个经验单元:
{ "问题模式": "欧洲跨国火车票预订成本过高或路线不优", "目标": "找到成本最低且换乘最合理的火车票组合", "解决方案轨迹": [ "使用聚合平台(如 Omio、Trainline)进行初步的跨国路线和时刻规划", "对长途或关键路段,分别查询各国铁路官网(如德国DB、法国SNCF)进行比价", "检查关键路段(如高铁、夜车)是否需要强制预订座位,并单独完成预订", "整合所有分段车票,生成统一的行程单" ], "适用场景": "领域:旅行规划,场景:欧洲自由行,难度:中级", "相关经验": "类似任务:廉价航空多段航程组合、日本铁路周游券(JR Pass)性价比计算"}
通过这个过程,海量的、一次性的操作记录,就变成了宝贵的、能反复使用的智慧。
怎么让 AI 高效地用这些经验呢?AGENT KB 论文提了一个很妙的师生模式。关键是,老师不是等学生犯错了才出来,而是在整个过程中一直在旁边看着、指导着。
假设一个 AI 接到个新任务:帮一个用户规划第一次日本自由行。
学生 Agent - 领个大方向:
老师 Agent - 全程监督和细节提醒:
学生 Agent - 听取指导并修正:
这个师生合作的模式,把宏观的战略(学生搜来的)和微观的技巧(老师实时提醒的)结合了起来,最大的好处就是大大减少了无效的试错。AI 不用再自己去撞南墙了,而是出发前就拿到了地图,每个路口还有导航员实时提醒。
这个经验库不是一成不变的,它是一个能动态进化的生态。
有了这一层,AI 才算真正学会了“传承”和“借鉴”。它不再是一个孤独的探索者,而是站在所有前人的智慧之上。
好了,我们把这三层合起来,看看一个拥有这种记忆系统的 AI 旅行规划师“小旅”是怎么工作的。
开始:一个简单的想法
李明对小旅说:
“嘿,我想去意大利旅行,帮我规划一下吧。”
一个普通的 AI 可能会直接给你一个网上抄来的“罗马-佛罗伦萨-威尼斯”十日游。但小旅不一样。
第一步:翻开你的专属资料库 - “我记得你......”
小旅收到请求后,立刻去第一层资料库里翻看关于李明的所有信息。
初步画像形成:
这已经不是一个简单的“意大利旅行”了,而是一个非常具体的需求:“给热爱文艺复兴艺术、喜欢《教父》、想在10月去摄影的建筑设计师李明,规划一个两周的意大利行程。”
第二步:开始深度洞察 - “我懂你......”
这个初步画像被交给了第二层,深度洞察层的管理员开始在李明的个人知识网上深挖。
(电影《教父》)
和 (西西里岛)
这个地点连了起来。一个普通攻略里不常有的地方,就这么出现了。(李明) - [和...聊天] -> (前女友张悦)
,聊天内容里提到他们共同的梦想——“将来一定要一起去‘五渔村’看日落”。虽然这段关系早就结束了(关系线上有时间戳标记),但“五渔村”这个地方,和一个强烈的情感记忆绑在了一起。思考变得更有人情味:
AI 心里的计划变得更复杂了:“行程里得有西西里岛,满足他对《教父》的热爱。五渔村是个有特殊意义的地方,我可以把它作为一个可选项提出来,让他自己决定要不要去。住宿标准得是精品设计酒店,才符合他的身份。”
第三步:查阅大家的经验教训 - “我教你......”
现在,小旅已经很清楚要“为谁规划”和“规划什么”了,但“怎么规划得最好”,还需要经验库的帮助。
学生 Agent 向经验库提问,问题模式是“结合艺术、电影、摄影主题的意大利深度游规划”,场景是“10月份、中高端、可能自驾”。
获取宏观经验:经验库返回了一条高分经验:“1. 罗马和佛罗伦萨之间坐高铁,比飞机划算。2. 玩托斯卡纳最好是租车自驾,但一定要躲开ZTL(限行区)。3. 10月去乌菲兹美术馆人少,但票必须提前一个月在官网订,不然排队几小时。4. 西西里岛公共交通不方便,最好包车...”
老师 Agent 开始全程监督。当学生 Agent 规划到托斯卡纳自驾时,老师 Agent 立刻从经验库里找到一条相关的避坑技巧:“警告:托斯卡纳古城ZTL罚款超高!经验说,最好租带ZTL规避功能的车,而且酒店订在城墙外走路能到的地方,能省一大笔停车费和罚款。”
最终的规划指令成型
到此,小旅已经准备好了一份极其详尽的“提示词”,用来交给底层的大语言模型生成最终的规划。
# 角色和目标
你是个顶级的旅行规划专家,正在帮一个叫李明的客户做一个两周(10月)的意大利深度游。你的目标是做一个详细、贴心、能直接用的每日行程。
# 客户画像
- **身份**: 35岁建筑设计师,审美要求高。
- **兴趣**:
- 文艺复兴艺术:行程要重点安排佛罗伦萨,给乌菲兹美术馆留足时间。
- 电影《教父》:行程必须有西西里岛的相关地点。
- 摄影:要考虑托斯卡纳的田园风光,给日出日落的“黄金时间”留出拍照空档。
- **预算和风格**: 中高端,住精品设计酒店。
- **个人历史**:
- 五渔村对他有特殊意义(和一段旧恋情有关)。把它设计成一个可选项,可以去一两天,描述的时候巧妙地提一下那是个适合独自回忆或创造新记忆的地方,让他自己选。
- **健康提醒**: 他花生过敏,推荐餐厅时要特别注明,并附上一句意大利语的“我对花生过敏”("Sono allergico/a alle arachidi")。
# 执行方法和最佳实践
- **交通**:
- 大城市之间(罗马-佛罗伦萨)坐高铁。
- 托斯卡纳必须安排自驾。租车方案要说清楚包含全险和ZTL规避功能。行程里要标出推荐的城外停车场。
- 西西里岛建议包车或跟小团。
- **门票**:
- 乌菲兹美术馆和梵蒂冈博物馆的票,要在行程里标明“必须马上去官网预订”,并附上链接。
- **小提示**:
- 提醒他带上自己存的“常用意大利语短语”PDF,并建议装个离线翻译APP。
# 输出格式
根据以上所有信息,生成一份详细的每日行程规划
(注:提示词中黑色文字来自第一层记忆、蓝色文字来自第二层记忆、红色文字来自第三层记忆)
最终的输出
当语言模型拿到这份具体到发指的指令后,它生成的结果,绝对不是网上那些千篇一律的攻略能比的。那会是一份充满了理解、洞察和专业建议的完美行程:佛罗伦萨的安排会细致到哪个美术馆值得逛半天;托斯卡纳的自驾路线会标出最佳拍照点和安全停车区;西西里岛的描述会巧妙地融入《教父》的元素;而关于五渔村的建议,则会写得温暖又有分寸,给他充分的选择空间。
这,就是一个拥有三层记忆大脑的 AI 能做到的事,一种真正的“智能”。
从第一层的精细记录,到第二层的深度洞察,再到第三层的集体智慧,我拼出来的这个三层记忆架构,给如何实现一个好用的 AI Agent 记忆系统,画了一条还算清晰的路。
有了这个架构,AI 就不再是个冷冰冰的问答工具了。
这不只是技术上的进步,更可能重塑我们和 AI 的关系。当然,这条路还很长,数据隐私、经验质量怎么控制等等问题都还在。但通往真正懂你的、聪明的 AI 的那扇门,好像已经被推开了一条缝。门后的世界,我觉得值得我们去期待。
致谢:引力城智能技术院的何总,在本文成文的过程中提供宝贵的参考材料和建议。
#智能体 #Agent #认知架构 #记忆系统 #经验工程 #知识图谱 #上下文工程 #提示工程
53AI,企业落地大模型首选服务商
产品:场景落地咨询+大模型应用平台+行业解决方案
承诺:免费POC验证,效果达标后再合作。零风险落地应用大模型,已交付160+中大型企业
2025-08-21
2025-05-29
2025-06-01
2025-06-21
2025-06-07
2025-06-12
2025-08-19
2025-06-19
2025-06-13
2025-05-28
2025-08-22
2025-08-22
2025-08-21
2025-08-20
2025-08-19
2025-08-19
2025-08-18
2025-08-18