我要投稿

这就是AI智能体的记忆机制原理

发布日期：2025-03-29 07:08:55 浏览次数： 2301

作者：PyTorch研习社

微信搜一搜，关注“PyTorch研习社”

一般来说，Agent（智能体）的记忆是通过在传递给 LLM 的 Prompt（提示）中提供上下文实现的，使 Agent 能够基于过去的交互或无法立即获取的数据更好地规划和响应。

我们通常将记忆分为四种类型：

1. 情景记忆（Episodic Memory）

这种记忆类型包含 Agent 过去的交互和执行的动作。当 Agent 执行某个操作后，控制 Agent 的应用程序会将该操作存储到某种持久化存储中，以便日后检索。一个典型示例是使用向量数据库（Vector Database）存储交互的语义信息。

2. 语义记忆（Semantic Memory）

这是 Agent 可用的任何外部信息，以及 Agent 自身应具备的知识。可以将其类比为 RAG（Retrieval-Augmented Generation，检索增强生成）应用中的上下文。语义记忆可以是仅供 Agent 内部使用的知识，也可以是某种“锚定上下文”（Grounding Context），用于从互联网上的大规模数据中筛选出更相关的信息，以提高回答的准确性。

3. 程序性记忆（Procedural Memory）

这部分包含系统性的信息，例如 System Prompt 的结构、可用工具、约束机制（Guardrails）等。通常，这些内容存储在 Git 仓库、Prompt 管理库或工具注册表中（Prompt and Tool Registries）。

4. 长期记忆检索

在某些情况下，Agent 应用程序会从长期记忆（Long-Term Memory）中提取信息，并将其存储到本地，以便在当前任务中使用。

5. 短期记忆（Short-Term Memory）

所有从长期记忆中提取或存储在本地的记忆被称为短期记忆或工作记忆（Working Memory）。将这些信息编译成 Prompt 后传递给 LLM，LLM 会基于这些信息生成接下来的行动指令。

通常，我们将 1-3 归类为长期记忆（Long-Term Memory），而 5 归类为短期记忆（Short-Term Memory）。

? 这里有一份关于可能实现细节的可视化解释

至此，剩下的就是如何设计 Agentic Systems 的拓扑结构了。

53AI，企业落地大模型首选服务商

产品：场景落地咨询+大模型应用平台+行业解决方案

承诺：免费POC验证，效果达标后再合作。零风险落地应用大模型，已交付160+中大型企业

相关资讯

2025-07-29

一小时内构建基于Gemma与Bright Data的生产级RAG应用

2025-07-28

做RAG系统到底是选MaxKB还是FastGPT

2025-07-28

企业RAG之构建 FastMCP 服务：基于模型上下文协议的智能服务体系搭建实践

2025-07-28

RAG数据准备完整实战指南：从原始文档到高质量知识库

2025-07-28

企业RAG之数据源构建：爬取巨潮资讯网上市企业年报

2025-07-28

HiRAG：一种基于层级知识索引和检索的高精度RAG

2025-07-28

长文本放提示词中还是采用 RAG？

2025-07-28

检索链路全优化：查询重写、重排与压缩如何提升 RAG 效果

了解更多

了解更多

160+中大型企业正在使用53AI

立即咨询预约演示

把握AI发展的机遇，共同探索、共同进步

2025-01-22

如何打造基于GenAI的员工服务机器人

2025-01-22

热点资讯

RAG技巧与底层代码剖析

2025-06-06

2025年GitHub上十大RAG框架深度解析：从技术原理到实战应用

2025-05-30

RAGFlow中的Embeddings模型选择及向量数据库选型与实现分析

2025-06-05

淘天⾃营质量技术AI智能体的实践和思考

2025-05-19

深度解读：LlamaIndex 实现 RAG 重排序的关键要点

2025-05-08

如何构建基于n8n的RAG日报工作流（手把手教程）

2025-05-10

RAG技术全解析：从基础原理到优化实战

2025-06-05

ragflow架构解析及性能优化方式

2025-05-20

知识图谱+RAG：大幅提升智能问答系统准确率

2025-06-05

让大模型“记住”更多：RAG与长期记忆

2025-05-09

大家都在问

长文本放提示词中还是采用 RAG？

2025-07-28

AI大模型落地最后一公里：RAG？

2025-07-09

向量相似度检索遇到天花板，是否我们走错了？

2025-07-04

RAG检索策略深度解析：从BM25到Embedding、Reranker，如何为LLM选对“导航系统”？

2025-07-01

从碎片到图谱：Graph RAG如何用知识网络颠覆传统搜索？

2025-07-01

qodo如何构建大型代码仓库的RAG？

2025-07-01

RAG系统的“聪明药”：如何用反馈回路让你的AI越用越聪明？

2025-07-01

GraphRAG的索引动态更新解法-分桶+局部更新及“上下文工程”新概念？

2025-06-30

热门标签

内容创作大模型技术个人提效 langchain llamaindex 多模态技术 RAG技术智能客服知识图谱模型微调 RAGFlow coze Dify Fastgpt Bisheng Qanything AI+汽车 AI+金融 AI+工业 AI+培训 AI+SaaS 提示词框架提示词技巧 AI+电商 AI面试数字员工 ChatBI 知识管理开源大模型智能营销智能硬件智能化改造 AI+医疗 MaxKB

应聘简历请发送至： ceo@53ai.com

友情链接：

CopyRight © 2012-2024 深圳市博思协创网络科技有限公司版权所有

粤ICP备14082021号

广州：广州市华景路37号(华景软件园)暨南大学科技大厦6楼（整层）

深圳：深圳市福田区泰然四路29号天安创新科技广场一期A座1204

上海：上海市浦东新区金新路58号1602室

微信扫码
和创始人交个朋友

联系我们

售前咨询

预约演示

微信扫码

添加专属顾问

回到顶部