免费POC, 零成本试错
AI知识库

53AI知识库

学习大模型的前沿技术与行业应用场景


大模型“失忆”困境下的破局:360智脑推出自研记忆体 Mem360

发布日期:2025-09-24 20:14:59 浏览次数: 1515
作者:360智脑

微信搜一搜,关注“360智脑”

推荐语

360智脑推出革命性记忆体方案Mem360,让大模型摆脱"失忆"困境,实现低成本、高效能的长期记忆存储。

核心内容:
1. Mem360的四大核心理念:外挂式存储、模块化设计、多模态架构、安全持久方案
2. 在LoCoMo评测中展现的领先性能,尤其在时序推理等关键指标上的突破
3. 作为AI认知框架升级,贯穿从信息感知到自适应决策的全链路智能进化

杨芳贤
53AI创始人/腾讯云(TVP)最具价值专家

360 智脑记忆体方案 Mem360 服务,近日已上线 360 智脑 API 开放平台,敬请关注。

一、Mem360:让大模型拥有长期记忆

Mem360 的诞生源于对 AI 记忆本质的两大关键洞察:一方面,未来的 AI 应用,尤其是自主进化的 Agent,对持久化记忆能力存在必然需求;另一方面,这种记忆的实现应依托于高效、可控的外挂式方案,而非依赖模型内部参数或昂贵的长上下文。

我们对记忆的核心理念可概括为四个“不是”与“而是”的转变:

  • 不是让模型“背下来”,而是给它“带上记事本”:避免将海量数据硬编码进模型参数,转而采用外部记忆库作为独立存储层,确保记忆可审计、可更新。
  • 不是昂贵的长上下文,而是低成本的长久记忆:通过模块化设计,Mem360 将记忆存储与模型推理解耦,大幅降低对长上下文窗口的依赖,实现经济高效的记忆复用。
  • 不是单一存储,而是多模态、多层次的记忆架构:支持文本与图片等多模态输入,并模拟人类记忆体系(情景、语义、程序记忆),构建立体化知识网络。
  • 不是不稳定的临时存储,而是可控、安全、持久的外挂方案:强调数据隔离、加密存储和全链路审计,确保记忆的可靠性与隐私合规性。

Mem360 作为应用与模型之间的“语义记忆层”,贯穿从信息感知到自适应决策的全链路。它不仅是技术方案,更是对 AI 认知框架的升级——让记忆成为 AI 智能进化的基石。

理念之外,Mem360 的价值也在系统评测中得到了充分验证

在记忆体领域公认的 LoCoMo 评测集上,我们对比了包括传统 RAG、开源记忆体方案(mem0、memos、memU 等)在内的多种方法,覆盖整体表现、时序推理 (Temporal Reasoning)、多跳推理 (Multi-hop Reasoning)、单跳推理 (Single-hop Reasoning)、开放域问答 (Open-domain QA) 等核心任务。评测结论显示,Mem360方案在时序推理 (Temporal Reasoning)核心指标上显著领先,其余指标也均处于头部水平,最终整体指标上表现领先,展现了在复杂推理、长期记忆保持、个性化建模等方面的优势。

Locomo评测集
Overall
temporal reasoning
open domain
multi hop
single hop
RAG
48.10
37.82
23.02
34.41
64.30
A–Mem
48.38
49.91
54.05
18.85
39.79
LangMem
58.10
23.43
71.12
47.92
62.23
Zep*
65.99
49.31
76.60
41.35
61.70
Mem0
66.88
55.51
72.93
51.15
67.13
MemU*
69.03
51.62
53.22
69.68
76.61
MemOS
73.63
68.71
55.34
71.80 78.60
Mem360 76.46 83.32
59.60
70.40
75.85

同时,我们也在 PersonaMem 和 LongMemEval 两大主流基准上与主流开源方案进行了系统对比,结果表明 Mem360 同样实现了全面超越现有方法的表现,进一步验证了其在通用性与稳健性上的突出优势。

注:本次评估采用 Locomo / LongMemEval / PersonaMem 三个公开基准评测数据,对比方案的评测结果是基于其开源代码在统一实验条件和数据环境下的复现结果,可能出现某些指标结果与其官方公布的存在差异,本文重点展示在相同环境下的相对表现与趋势。

二、为什么需要记忆“外挂”?

当前的大模型在推理和生成方面展现出了强大能力,但仍普遍面临“失忆”的困境,而这也成为制约 AI 应用真正落地的关键障碍。比如在日常办公中,AI 无法记住项目进展,难以提供连续性支持;在企业客服中,缺乏客户历史沉淀,导致服务体验割裂;而在个人助手场景中,用户希望获得长期陪伴感,但现有模型仅能维持短期对话能力。

尽管业界早已尝试长上下文、参数化记忆、RAG 检索等方案,但在成本、灵活性和可靠性上,都存在各自的缺点:

长上下文:成本高昂,难以持久

  • 推理开销随上下文长度指数级增长,token 成本骤升;
  • 仅能作为“工作记忆”,无法跨会话沉淀;
  • 超长后容易造成记忆断裂,导致回答不一致。

参数化记忆:更新受限,不够灵活

  • 知识更新需全量微调,算力消耗巨大;
  • 新知识写入往往以遗忘旧知识为代价;
  • 模型固化,无法动态响应用户的实时数据或个性需求。

RAG 检索:效率与精度失衡

  • 基于全量原始历史对话进行相似度检索,存在语义漂移风险,易召回无关、无价值对话,引发模型“幻觉”;
  • 记忆过于凌乱&碎片化,终端用户难以有效管理和掌控,易造成低质历史对话反复引用,体验不佳。

因此,要让大模型突破“短期对话工具”的局限,进化为具备长期认知个性化交互的智能体,亟需一种独立于参数更新和上下文窗口的动态外挂记忆架构。这一架构能够有效应对知识碎片化、更新滞后、成本高企等核心痛点,为 AI 的大规模落地提供关键支撑。

三、Mem360记忆框架解析

1.方案总览:统一记忆体的全景蓝图

Mem360 是 360 智脑自研的统一记忆体方案,灵感源自人类记忆机制,专为AI应用和Agent设计。其核心在于“多层次、多模态、动态更新”的架构,为用户提供一站式记忆服务:

1)多层次记忆体系

模拟人类记忆的层次性,Mem360 将记忆划分为以下三类:

  • 情景记忆(Episodic Memory)记录具体事件、时间与场景(尤其是多模态画面类记忆)。
  • 语义记忆(Semantic Memory)沉淀稳定事实与知识图谱(如用户画像、偏好或行业知识),支持长期知识问答。
  • 程序记忆(Procedural Memory)存储工具使用经验、策略与工作流程(如任务执行路径),赋能Agent自主决策。

2)多模态与时间维度融合

  • 多模态支持:同时处理文本与图片记忆,图片被解析为结构化线索并作为附加字段存储,与文本记忆协同,实现跨模态检索和召回。
  • 长/中/短期协同:
    • 短期记忆(Working Memory):保留最近对话上下文(如即时意图),生命周期短、更新频繁。
    • 中期记忆(MediumTerm Memory):覆盖阶段性任务(如多轮会话摘要),提供主题连续性。
    • 长期记忆(LongTerm Memory):持久化关键知识(如用户画像),支持跨会话追溯。
  • 记忆生命周期管理:通过适时遗忘机制,避免记忆无限膨胀;同时模拟人类,能主动、快速地淡化无价值或负面记忆,避免记忆外挂出现“互联网不会遗忘”的天然缺陷。

3) 混合存储与统一接口

  • 混合存储引擎:结合向量库(用于语义相似度召回)和图数据库(维护实体关系网络),兼顾“近义聚合”与“因果推演”。
  • 统一处理器设计:通过 UnifiedMemoryProcessor 协调模块,对外暴露一致的 API,无缝兼容 RAG、Agent 框架及企业应用,实现记忆的存取、检索全流程管理。

这一方案不仅简化了开发集成,还确保了记忆的灵活扩展——Mem360 如同 AI 的“记忆中枢”,让碎片化信息升华为结构化知识。

2.特色亮点:智能记忆的革新优势

Mem360 的核心亮点包括以下四个方面:

1)深度模拟人类记忆

Mem360 深度借鉴人类认知科学,实现记忆的“拟人化”:

  • 多层次记忆体系:借鉴人类记忆的层次结构,构建 情景记忆(事件与多模态场景)、语义记忆(稳定知识与用户画像)、程序记忆(流程经验与工具策略),以支持长期认知与自主决策。
  • 智能遗忘机制:引入记忆TTL(生存时间)和可信度衰减机制,自动失效过期的记忆点,同时通过版本控制避免信息污染,支持针对记忆的管理操作,保障可控性。

2)多模态记忆融合

Mem360 突破单一文本局限,实现跨模态的记忆构建与召回:

  • 多模态记忆提取:当前多模态大模型的应用场景众多,Mem360 不仅支持文本输入,还可处理图像等多模态数据,并从中自动抽取关键长期记忆点,沉淀为可持续调用的知识资产。
  • 多模态记忆召回:支持图片式记忆存储,如用户历史上传宠物图片,后续咨询宠物穿搭建议时,系统可自动召回宠物相关记忆和对应图片,方便下游基于实际宠物图片进行图生图、图生视频等操作,生成个性化方案。这突破了单一模态的局限,提升记忆的丰富性和实用性。

3)记忆效果领先

记忆的价值在于即时召回,Mem360 通过在记忆的构建、记忆数据的更新、记忆的检索整个 pipline 进行精细化设计,提升精度与效率:

  • 向量库+图数据库一体化架构:同时兼顾向量语义召回效率与知识图谱扩展性,并通过双库一一对应实现深度协同,打造真正兼具 精准、可拓展、可进化 的智能记忆底座。
  • 高级检索策略:融合向量/关键词的语义检索(快速匹配相似内容)、图关系检索(实体邻接扩展)和任务目标解析,支持上下文敏感召回(按用户、意图或时序过滤)。

4)低成本接入

Mem360 以“外挂式”设计降低集成门槛:

  • 框架解耦:Mem360 聚焦个体记忆,与现有 AI 应用、Agent 框架解耦,业务通过统一API/MCP 即可快速嵌入现有流程。
  • 完善的记忆接口:提供了完整的记忆管理接口,包括添加记忆、检索记忆、获取记忆列表、删除记忆等,接入简单高效。

四、欢迎体验

有了记忆,AI 才真正懂你的用户!

我们的外挂记忆库,已经准备好为各类 AI 应用赋能,让您的应用体验更贴心、更聪明。为了方便大家体验和快速集成,同时满足 AI 应用面向的终端用户随时查看、编辑或删除自己的记忆,确保数据透明与可控的诉求,我们也在 360 智脑 API 开放平台提供了完整的记忆管理 API 接口。

未来,我们将陆续开放记忆管理 MCP 和 Playground 并上线至360智脑API平台,持续丰富产品生态,帮助开发者和企业构建更强大的智能应用。

如有 SaaS 调用需求私有化部署场景,欢迎通过邮箱(g-api-service@360.cn)联系我们!

53AI,企业落地大模型首选服务商

产品:场景落地咨询+大模型应用平台+行业解决方案

承诺:免费POC验证,效果达标后再合作。零风险落地应用大模型,已交付160+中大型企业

联系我们

售前咨询
186 6662 7370
预约演示
185 8882 0121

微信扫码

添加专属顾问

回到顶部

加载中...

扫码咨询