微信扫码
添加专属顾问
我要投稿
中国科学家突破AI记忆瓶颈,全球首款记忆操作系统MemOS让AI真正拥有"人脑记忆",逻辑推理能力提升159%,反应速度提升94%! 核心内容: 1. MemOS系统如何解决AI"记忆孤岛"问题 2. 系统在逻辑推理和反应速度上的突破性表现 3. 记忆标准化模块在各行业的应用前景
中国科学家搞出大新闻!全球首个"记忆操作系统"MemOS横空出世,AI这下真要有"人脑记忆"了!
上海交大、浙大的学霸天团最近整了个黑科技,给AI装上了"最强大脑"。就像电脑需要Windows系统管理CPU和硬盘,他们开发的MemOS系统能让AI像人类一样记住事情,还能越用越聪明!现在的大模型就像金鱼记忆,聊完就忘,下次见面又得重新自我介绍——你刚说完对海鲜过敏,转头它就能给你推荐海鲜大餐,你说气人不气人?
该系统名为url=https://memos.openmem.net/]MemOS[/url],将内存视为核心计算资源,可以进行调度、共享和随时间演进——类似于传统操作系统管理 CPU 和存储资源的方式。这项研究于7 月 4 日发表在 arXiv 上。
研究人员在论文中写道:“大型语言模型 (LLM) 已成为通用人工智能[/url的重要基础设施,但它们缺乏明确定义的内存管理系统,阻碍了长上下文推理、持续个性化和知识一致性的发展。”
这个系统有多牛?在"记忆力大考"中直接把OpenAI按在地上摩擦!做逻辑推理题时分数暴涨159%,就像学渣突然开挂考了年级第一。最绝的是反应速度,某些情况下生成答案的第一句话能快94%,比5G冲浪还丝滑。
人工智能系统难以在对话中保持记忆
当前的人工智能系统面临着研究人员所称的“记忆孤岛”问题——这是一种根本性的架构限制,阻碍了它们与用户维持连贯的长期关系。每次对话或会话基本上都是从零开始,模型无法保留用户在交互过程中的偏好、积累的知识或行为模式。这会带来令人沮丧的用户体验,因为人工智能助手可能会在下一次对话中被问及餐厅推荐时忘记用户在上一次对话中提到的饮食限制。
虽然一些解决方案,例如检索增强生成 (RAG),试图通过在对话过程中引入外部信息来解决这个问题,但研究人员认为,这些仍然是“没有生命周期控制的无状态解决方法”。这个问题比简单的信息检索更深层次——它关乎创建能够真正从经验中学习和进化的系统,就像人类记忆一样。
该团队解释说:“现有模型主要依赖于静态参数和短暂的上下文状态,这限制了它们追踪用户偏好或长期更新知识的能力。” 这种局限性在企业环境中尤为明显,因为企业期望AI系统能够在可能持续数天或数周的复杂、多阶段工作流程中维护上下文信息。
简单总结:其实现在AI的"健忘症"可把企业坑惨了。比如市场部用ChatGPT分析了三天三夜的客户数据,换了个AI工具又得从头再来,简直让人抓狂。MemOS的杀手锏是搞出了"记忆魔方",能把各种经验打包成标准化模块。以后医生可以把看诊经验做成记忆胶囊,医学生装上就能秒变专家;打工人跳槽时还能把职场技能打包带走,再也不用在新公司装小白!
新系统显著提升了人工智能推理任务
MemOS 通过研究人员所称的“ [url=https://github.com/MemTensor/MemOS]MemCubes ”引入了一种截然不同的方法——标准化的记忆单元,可以封装不同类型的信息,并随着时间的推移进行组合、迁移和演化。这些单元涵盖了从基于文本的显式知识到模型内参数级的自适应和激活状态,从而创建了一个此前从未存在过的统一记忆管理框架。
在评估内存密集型推理任务的LOCOMO 基准测试中,MemOS 在所有类别中的表现均优于既定基准。与 OpenAI 的内存实现相比,该系统整体性能提升了 38.98%,在需要跨多个对话回合连接信息的复杂推理场景中,其提升尤为显著。
研究表明:“MemOS(MemOS-0630)在所有类别中始终排名第一,其表现优于 mem0、LangMem、Zep 和 OpenAI-Memory 等强大的基准,尤其是在多跳和时间推理等具有挑战性的环境中,其优势尤为显著。”
该系统还显著提高了效率,通过其创新的 KV 缓存内存注入机制,在某些配置下可将第一个令牌的延迟时间缩短高达 94%。
这些性能提升表明,内存瓶颈比之前理解的更为严重。通过将内存视为一流的计算资源,MemOS似乎能够释放此前受架构限制的推理能力。
该技术可能会重塑企业部署人工智能的方式
这对于企业 AI 部署的影响可能具有变革性,尤其是在企业越来越依赖 AI 系统来维护与客户和员工之间复杂且持续的关系的情况下。MemOS 实现了研究人员所描述的“跨平台内存迁移”,允许 AI 内存在不同平台和设备之间移植,打破了目前将用户上下文限制在特定应用程序中的“内存孤岛”。
想象一下,许多用户在某个 AI 平台上探索到的洞察无法迁移到另一个平台时所经历的挫败感。营销团队可能通过与 ChatGPT 的对话构建了详细的客户画像,但当切换到另一个 AI 工具进行营销活动策划时,却不得不从头开始。MemOS 通过创建一种可在系统间移动的标准化内存格式来解决这个问题。
该研究还概述了“付费记忆模块”的潜力,领域专家可以将他们的知识打包成可购买的记忆单元。研究人员设想的场景是,“临床轮转的医学生可能希望学习如何治疗一种罕见的自身免疫性疾病。经验丰富的医生可以将诊断启发法、提问路径和典型病例模式封装到结构化记忆中”,而其他人工智能系统可以安装和使用这种记忆。
这种市场模式将从根本上改变人工智能系统中专业知识的分配和货币化方式,为专家创造新的经济机会,同时实现高质量领域知识的民主化获取。对于企业而言,这意味着可以快速部署在特定领域拥有深厚专业知识的人工智能系统,而无需承担传统定制培训所需的成本和时间。
三层设计反映了传统的计算机操作系统
技术宅们把这套系统做成三层夹心蛋糕:最上面接客(API接口),中间当管家(安排记忆调用),底层当仓库(存记忆)。就像电脑从DOS升级到Win11,AI也要迎来划时代变革!研究团队还特别大气,直接把代码开源扔GitHub上了,摆明了就是要改变世界。
MemOS 的技术架构体现了数十年来对传统操作系统设计的经验积累,并针对 AI 内存管理的独特挑战进行了调整。该系统采用三层架构:用于 API 调用的接口层、用于内存调度和生命周期管理的操作层以及用于存储和治理的基础设施层。
该系统的 MemScheduler 组件动态管理不同类型的记忆——从临时激活状态到永久参数修改——并根据使用模式和任务需求选择最佳的存储和检索策略。这与当前的方法截然不同,当前的方法通常将记忆视为完全静态的(嵌入在模型参数中)或完全短暂的(仅限于对话上下文)。
研究人员在描述他们对“记忆训练”范式的愿景时指出:“重点从模型一次学习了多少知识,转移到它能否将经验转化为结构化记忆,并反复检索和重建。” 这种架构理念表明,我们需要从根本上重新思考人工智能系统的设计方式,从当前的大规模预训练范式转向更具动态性、以经验为导向的学习方式。
这与操作系统开发有着惊人的相似之处。正如早期计算机需要程序员手动管理内存分配一样,当前的人工智能系统也需要开发人员精心协调不同组件之间的信息流。MemOS 简化了这种复杂性,有望催生新一代人工智能应用,这些应用无需深厚的技术专业知识,即可在复杂的内存管理基础上构建。
研究人员将代码开源以加速采用
该团队已将 MemOS 作为开源项目发布,其完整代码可在 GitHub 上获取,并为 HuggingFace、OpenAI 和 Ollama 等主流 AI 平台提供集成支持。这一开源策略旨在加速采用并鼓励社区发展,而非追求可能限制广泛应用的专有方法。
项目负责人李志宇在 GitHub 代码库中评论道:“我们希望 MemOS 能够助力 AI 系统从静态生成器发展为持续演进、内存驱动的智能体。” 该系统目前支持 Linux 平台,并计划支持 Windows 和 macOS,这表明团队更重视企业和开发者的采用,而非消费者的即时可及性。
开源发布策略反映了人工智能研究领域的一个普遍趋势:基础设施的改进公开共享,以造福整个生态系统。这种方法历来加速了深度学习框架等领域的创新,并可能对人工智能系统的内存管理产生类似的效果。
科技巨头竞相解决人工智能内存限制
现在科技巨头们都抢着解决AI记忆问题,就像当年手机厂商比拼摄像头。OpenAI刚给ChatGPT加了记忆功能,谷歌亚马逊也在暗中较劲。但中国团队这次走在了前面——有时候突破不一定靠堆硬件,换个思路也能弯道超车。说不定哪天你的AI助理真能记住你爱吃辣、怕香菜,成为比对象还懂你的贴心小棉袄呢!
行业观察人士早已预测,人工智能的下一个重大突破并不一定来自更大的模型或更多的训练数据,而是来自能够更好地模拟人类认知能力的架构创新。
记忆管理正是代表了这种根本性的进步——它可以解锁当前无状态系统无法实现的新应用和用例。
这项进展代表了人工智能研究领域更广泛转变的一部分,即转向更具状态性、更持久的系统,这些系统能够随着时间的推移积累和发展知识——这些能力被视为通用人工智能 (AGI) 的必备能力。对于评估人工智能实施的企业技术领导者来说,MemOS 可能代表着构建能够保持上下文并随时间推移而改进的人工智能系统的重大进步,而不是将每次交互视为孤立的。
53AI,企业落地大模型首选服务商
产品:场景落地咨询+大模型应用平台+行业解决方案
承诺:免费场景POC验证,效果验证后签署服务协议。零风险落地应用大模型,已交付160+中大型企业
2025-07-10
实战、通俗、落地:大模型浪潮指南
2025-07-10
从谨慎检查到一键接受,TRAE 如何成为我的主力 IDE?
2025-07-10
2025上半年,AI Agent领域有什么变化和机会?| 峰瑞研究所
2025-07-10
刚刚,马斯克发布Grok-4,在各大基准测试上表现太猛了。
2025-07-10
Grok4 发布:全整理
2025-07-10
马斯克发布Grok 4,推理能力全面登顶,支持四个代理同时工作
2025-07-10
xAI 发布 Grok 4,它具备超人级别的推理能力!
2025-07-10
刚刚,突发,炸裂!Grok 4发布,全科能力超越博士!
2025-05-29
2025-04-29
2025-04-29
2025-05-23
2025-04-12
2025-05-07
2025-05-07
2025-05-07
2025-06-01
2025-05-07
2025-07-10
2025-07-10
2025-07-10
2025-07-09
2025-07-08
2025-07-07
2025-07-05
2025-07-04