2026年7月2日 周四晚上19:30,报名腾讯会议了解“如何构建自进化的动态知识库(Brain)”(限30人)
免费POC, 零成本试错
FDE知识库

FDE知识库

学习大模型的前沿技术与行业落地应用


收藏

让大模型“记住”更多:RAG与长期记忆

发布日期:2025-05-09 19:07:13 浏览次数: 3975
作者:智见AGI

微信搜一搜,关注“智见AGI”

推荐语

了解RAG技术如何增强大模型的记忆能力,突破传统对话限制。

核心内容:
1. RAG技术简介及其在大模型中的应用
2. RAG技术的核心流程:数据检索、信息增强和生成回答
3. 长期记忆的必要性及其与RAG技术的结合

杨芳贤
53AI创始人/腾讯云(TVP)最具价值专家

OpenAI近期发布的更新增强了原本ChatGPT的记忆功能,新版本的GPT模型在回复用户问题的时候,除了记住用户过往的聊天记录,还能够跨聊天调取记忆,从而生成更加准确性的回答。



在此之前,我们使用ChatGPT等类似的AI聊天软件时,对话与对话之间的信息是不共享的,这就导致了一个问题:我们每次在新开启一个对话的时候,都要重复地告诉大模型一些“背景信息”。相信大家在遇到这种情况的时候会很自然的思考一个问题:能否让大模型“记住”我之前说的话?

这就是长期记忆所希望解决的问题。今天我们就来聊一聊,如何能让大模型“长记性”。


在介绍长期记忆之前,我们先来介绍一个与其相似的内容——RAG。


什么是RAG?


RAG,全称 Retrieval-Augmented Generation(检索增强生成),是 OpenAI、Meta 等公司提出的一种框架,用来增强语言模型的知识能力。它的提出是为了解决大模型”幻觉“问题。


简单来说,大模型在训练时学到很多东西,但它的知识是静态的,也就是说,训练之后模型就无法自动了解新的知识、动态变化的信息。这样带来的问题就是:在面对一般性场景的时候,大模型具有不错的表现;但是一旦被问到有关私有或专业数据源的信息,大模型就会生成一些不准确的回复,看起像是在”一本正经“地胡说八道,这就是大模型幻觉


所以针对不同专业领域的知识,大模型需要针对性的调整和优化,也就是监督微调(Supervised Fine-Tuning), 但是监督微调是一个很耗成本的事情,有没有什么办法可以降低这种定制化工程的成本呢?这就轮到RAG登场了。


RAG的原理在于结合信息检索与自然语言生成,以提高文本生成的质量和准确性。利用检索技术来增强生成模型的新功能,特别是在处理知识密集型任务时,通过结合外部知识库和语料库中的信息,RAG能够生成更加准确、详细和有用的信息。


所以,RAG的出现就像是给模型外挂了一个”搜索引擎“,模型不光是靠自己”硬想“,而是先查资料再回答问题



RAG 的核心流程:


1.数据检索


RAG利用检索模型在大量的语料库或数据库中搜索与输入查询相关的文本片段或信息。


2.信息增强


与整合检索到的相关信息片段会经过进一步处理,以便为后续的文本生成阶段提供有用的上下文或知识。(在某些情况下,RAG还可能对检索到的信息进行过滤、排序或重新组织,以确保其质量和输入查询的相关性。)


3.生成回答


模型结合检索到的信息和输入查询,RAG使用自然语言生成模型来生成新的文本内容。


这样,模型就能用上“外脑”信息,不再闭门造车了。

为什么需要“长期记忆”?


介绍完了RAG,我们再来看看长期记忆。


尽管RAG已经让大模型能实时查资料,但它并不会“记住”你以前说过的话。每次对话几乎都从零开始,这就带来了一个问题:“我们的对话不能建立起持续的上下文。”


而长期记忆系统的目标,就是像人类一样,建立起可随时访问和调用的“记忆库”


举个例子


你曾和一个智能助手聊过你喜欢旅游、爱吃辣、来自北方。下次再见面时,它还能主动问你:


“你上次提到喜欢大连的海边,这次计划去哪儿玩?”


这就是长期记忆的作用 —— 让AI真正了解你,并不断积累对话上下文和偏好信息



如何实现“长期记忆”?


讲完了概念,我们来看看如何实现这一过程。


1.向量数据库 + 检索(最常见)


也就是采用RAG的方式,将你的历史对话和个性化信息保存下来。具体流程就是将对话信息转换为向量,存入像FAISS、Milvus等向量数据库中,当模型需要”回忆“时,就向数据库中检索相关信息,并将结果加到模型输入的prompt中。


这种做法的好处是,因其基于现有的RAG系统,所以部署起来会相对简单;且由于向量数据库的加持,扩展性也会很强,最大可支持百万级的记忆内容。不过因为其没有对记忆进行分类的结构化存储,所以其在检索阶段会出现准确度低的问题,且在存储过程中可能无法理解”时间顺序“或”语境依赖“,导致记忆中忽略这部分的信息。


2. Slot-based 记忆管理(插槽式记忆)


向量数据库因为未采用结构化存储而导致其准确度低,那么为了解决这一问题,就需要对记忆进行结构化设计,也就是将记忆拆分为多个”插槽“。模型根据上下文选择要激活的插槽,动态组合prompt,从而生成更准确的回答。比如,大模型得到了一个user_input,内容为:“小明是重庆人,特别喜欢吃辣椒”。那么其结构化存储就可以按照如下的方式进行存储:


●用户姓名:小明

●喜好:爱吃辣

●背景信息:重庆人


这样做的好处在于:记忆的储存更加结构化方便了记忆存储与记忆召回。对于一些业务流程比较明确固定的场景,管理记忆的工作会更加方便。但是在实现过程中需要开发人员手动设定插槽,灵活性与兼容性很差。并且在插槽数量过多的时候管理起来十分复杂。


3.多轮对话链 + 自动总结(总结记忆)


既然插槽式记忆需要人工设计记忆结构,那么能不能让大模型自己去完成这个工作呢?总结记忆为这一问题提出了解决方案:让模型定期“写日记”,通过总结来压缩对话历史。即在每次对话结束时,就自动总结一段记忆,或者让模型定期地对过去的对话进行“反思”,存储对话中”高度抽象“的信息,而非其原始内容。


比如,用户询问了一些关于旅游攻略的信息,大模型将对话总结为:”用户计划去XX旅游,关注美食以及交通信息“。


这样的存储方式节省了token成本,让记忆更加紧凑,且更加接近”人类回忆“。但是因为其总结的过程时交给模型及进行处理,总结不准确会导致模型”误记“,并且总结的记忆中缺乏细节,会影响记忆召回的精确度。


混合式:当前最主流的解决方案


实际上,很多先进的长期记忆系统会融合以上几种方式:


比如:


●用 向量数据库存原始记忆片段

●用 slot 存储结构化长期信息(如角色设定、兴趣偏好)

●用 总结机制压缩上下文,提高效率


OpenAI、Meta、Anthropic、Mistral 等公司在构建 Agent 系统时,几乎都采用了这种“混合记忆架构”。


一些代表性的实践项目


除了长期记忆实现方式的简介之外,这里我们再介绍两种应用广泛的长期记忆系统:mem0与memGPT。


mem0:轻量、实用、以用为先的记忆系统


mem0是由社区开发者构建的轻量级长期记忆框架,非常适合实际部署在 AI 助手、智能体或应用中。


它的几个核心设计理念:


✅ 记忆是可搜索和可管理的:通过自然语言索引+向量化混合检索。

✅ 支持多记忆分层结构:如“人物档案”、“事件记录”、“标签主题”等。

✅ 支持自动摘要与反思机制:模型定期总结近期对话,形成更稳固的记忆基础。

✅ 支持“记忆触发器”机制:当对话触发某关键词或语义线索时,自动检索相关记忆。


mem0可以更方便地接入 LangChain、AutoGPT 等框架,是很多构建“有记忆智能体”的团队首选方案。


MemGPT:类人脑记忆的模拟器


MemGPT 是斯坦福等高校研究者提出的一种类人记忆架构,它引入了两个概念:


1.Working Memory(工作记忆):用于当前对话和任务的即时信息,类似人类短期记忆。


2.Long-Term Memory(长期记忆):存储历史重要信息,随时可检索,类似人类的回忆系统。


它最大的特点是:记忆不是固定插入的,而是由模型自主决定“写入”或“读取”。


●比如,当用户说出一句重要信息,MemGPT 会识别“这值得记住”,并自动存入长期记忆。


●未来对话中,如果触发相关线索,模型会主动“回忆”相关内容并应用到回答中。


这种机制让 AI 更像一个“会反思、有偏好、有选择性记忆”的智能体。


总结一下:


RAG + 长期记忆,强强联手!


RAG(检索增强生成)和长期记忆虽然都是为了提升大模型的响应质量,但两者的关注点不同:RAG 侧重于从外部知识库中检索事实性内容,比如文档、网页、数据库等;


而长期记忆更关注于用户本身的历史信息和对话上下文,比如你过去说过的话、提到的偏好或行为习惯。


也就是说,RAG 和记忆并不是非此即彼的互斥关系,而是互补的工具。RAG 解决的是广泛的知识检索问题,而记忆的目标是让 AI 具备贴心的个性化互动能力。


比如:


●RAG 负责回答“现在的天气、公司政策、产品文档”这些 通用问题


●长期记忆则负责记住“你是谁、你之前说过什么、你喜欢什么”这些 个性化信息


真正聪明的智能体,应该 既能查资料,也能记住你是谁。


应用场景:让AI变得更“聪明”且“有人味”

RAG+长期记忆不只是技术层面的升级,更是在重塑AI的角色定位——它不再是冷冰冰的工具,而是一个可以陪伴、理解、成长的“数智个体”。


1.企业“超级员工”


高效、稳定、永不离职的数字员工,正在悄悄重塑组织运作方式。


RAG+长期记忆可以赋能AI成为企业内部的“超级员工”:


记得每一位客户的历史沟通和偏好,避免重复沟通。


了解公司流程、项目背景、内部知识,做决策时更有上下文。


支持多角色协作:从HR到客服、从销售到产品,统一接入统一记忆库,实现多部门知识共享。


有了记忆的AI,不再是“问什么答什么”,而是能持续陪伴项目、学习成长的“虚拟同事”。


2.智能客服:会思考的贴心助手


不是简单答FAQ,而是真正记得你上次的诉求。


传统客服的弊端之一就是“记忆断裂”——每次咨询都像第一次见面。引入长期记忆后,AI客服可以:


记住用户历史问题和处理进度,自动续接上次未完的对话。


理解用户的习惯和情绪变化,自动调整语气风格。


结合RAG系统查阅最新政策,实现高效、准确、个性化的回复。


它不止是个客服,更像一个了解你需求、始终在线的私人助理。


3.学习助手:懂你的AI私教


不再千篇一律推荐,而是因材施教、持续跟进。


长期记忆让AI具备了“教学思维”:


●记住你的知识结构、薄弱环节和学习节奏。


●结合网络上的教材资料以及错题记录、学习目标,定制个性化学习路径


●跟踪学习进度,适时“复盘”知识点,而不是反复机械刷题。


它比任何App都懂你,也比任何老师更“及时”。


小结:未来AI会不会像人一样“有记忆”?


答案是:正在接近!


RAG赋予了大模型查找知识的能力,让大模型有能力成为各个领域的”专业人才”,而长期记忆的目标,是让模型真正像人类一样,有能力理解过去、现在和你自己。


未来的大模型智能体,应该具备这些记忆能力:


●记得“你是谁”


●记得“你说过什么”


●记得“你做过什么”


●更重要的是:知道什么时候应该回忆起它们


而这,才是通往“通用智能”的关键一步。


53AI,企业落地大模型首选服务商

产品:场景落地咨询+大模型应用平台+行业解决方案

承诺:免费POC验证,效果达标后再合作。零风险落地应用大模型,已交付160+中大型企业

联系我们

售前咨询
186 6662 7370
预约演示
185 8882 0121

微信扫码

添加专属顾问

回到顶部

加载中...

扫码咨询

扫码登录
登录即表示您同意《53AI网站服务协议》
服务协议

欢迎您使用【53AI 官方网站】(以下简称“本网站”或“我们”)。本《会员服务协议》(以下简称“本协议”)是您(以下简称“会员”或“用户”)与【深圳市博思协创网络科技有限公司】之间关于注册、登录及使用本网站会员服务所订立的法律协议。

在您注册或登录前,请务必审慎阅读、充分理解各条款内容,特别是免除或限制责任的条款、知识产权条款、争议解决条款等。此类条款将以加粗形式提示您注意。 当您通过微信公众号授权、手机验证码验证或其他方式成功登录本网站时,即视为您已完全理解并同意接受本协议的全部内容。

一、 定义

本网站:指由【深圳市博思协创网络科技有限公司】运营的,域名为【53ai.com】的网站及相关移动端页面。

会员服务:指本网站向注册会员提供的知识库文章查阅、内容检索及其他相关增值服务。

知识库内容:指本网站发布的包括但不限于文字、图表、数据、研究报告、行业分析等数字化内容资源。

二、 账号注册与登录

登录方式:本网站支持以下登录方式,您可根据实际情况选择:

微信公众号授权登录:您同意将您的微信OpenID信息授权给本网站,用于创建或关联会员账号。

手机验证码登录:您需提供真实有效的手机号码,并通过短信验证码完成身份验证与登录/注册。

账号安全:您的账号仅限您本人使用,禁止赠与、借用、租用、转让或售卖。因您保管不善导致的账号被盗、密码泄露等损失,由您自行承担。

实名认证:根据相关法律法规要求,我们可能要求您在特定功能下完成实名认证。如您拒绝提供,可能无法使用部分或全部服务。

未成年人保护:若您未满18周岁,请在法定监护人的陪同下阅读本协议,并在征得监护人同意后使用本服务。

三、 服务内容与规范

知识库查阅权限:会员登录后,有权按照其会员等级对应的权限范围,在线浏览、检索本网站知识库中的相关文章及内容。

服务变更:我们有权根据业务发展需要,调整、变更或终止部分服务内容,并将以网站公告、公众号消息等方式提前通知。

禁止行为:您在使用服务时不得实施以下行为:

利用技术手段批量爬取、下载、转存知识库内容;

将知识库内容用于商业目的或未经授权地向第三方传播;

干扰本网站正常运行或侵犯其他用户合法权益;

发布违法违规信息或从事违反公序良俗的活动。

四、 知识产权声明

权利归属:本网站知识库中的排版设计、软件代码等内容的知识产权均归【公司全称】或原权利人所有,受《中华人民共和国著作权法》等法律保护。

有限许可:本网站授予会员一项非独占、不可转让、不可转授权的普通许可,仅限于个人学习、研究之目的在线查阅知识库内容。

侵权追责:未经书面许可,任何单位或个人不得以任何形式复制、转载、摘编、镜像、汇编或以其他方式使用上述内容。一经发现,我们保留追究其法律责任的权利。

五、 个人信息保护

我们重视对您个人信息的保护。关于我们如何收集、使用、存储和保护您的个人信息,请单独阅读 《隐私政策》。

您通过微信公众号授权或手机号验证所提供的信息,我们将严格按照《个人信息保护法》的规定处理,仅用于身份识别、服务提供及安全验证等必要用途。

您可以随时通过网站设置或联系客服行使查阅、更正、删除个人信息及撤回授权同意的权利。

六、 免责声明

内容准确性:知识库内容仅供参考,不构成专业建议。我们不对其完整性、准确性、时效性作任何明示或暗示的保证,您应自行判断并承担使用风险。

不可抗力:因自然灾害、政策法规变化、网络故障、第三方平台接口异常(如微信接口维护、运营商短信通道故障)等不可抗力导致的服务中断或延迟,我们不承担违约责任。

第三方链接:本网站可能包含指向第三方网站的链接,该等网站的内容和服务不受我们控制,请您自行甄别风险。

七、 违约责任

如您违反本协议约定,我们有权视情节采取警告、限制功能、暂停服务、注销账号等措施,并保留要求赔偿损失的权利。

如因您的违约行为导致我们遭受行政处罚、第三方索赔或商誉损失,您应承担全部赔偿责任(包括但不限于罚款、赔偿金、律师费、公证费等)。

八、 法律适用与争议解决

本协议的订立、执行和解释均适用中华人民共和国大陆地区法律。

因本协议产生的或与本协议有关的任何争议,双方应友好协商解决;协商不成的,任何一方均可向【公司所在地】有管辖权的人民法院提起诉讼。

九、 其他

本协议构成双方就本服务达成的完整协议,取代此前任何口头或书面约定。

本协议任一条款被认定为无效或不可执行的,不影响其他条款的效力。

我们对本协议享有最终解释权,并在法律允许的范围内保留随时修改的权利。修改后的协议一经公布即生效,继续使用服务即视为同意修订内容。


已查阅