我要投稿

有人逆向拆解了ChatGPT 的记忆功能

发布日期：2025-12-17 13:03:11 浏览次数： 2243

作者：胡言Ray语

微信搜一搜，关注“胡言Ray语”

2025年在开发创业产品的时候，有一个比较困扰团队的问题就是“记忆”模块怎么写：一方面行业里从Mem0开始各种刷榜SOTA的第三方记忆服务就层出不穷，从RAG到GraphRAG到艾宾浩斯遗忘曲线，怎么高端大气上档次怎么来。另一方面实际一试呢，就非常像接入了一个又一个阿尔兹海默+强迫性幻想综合患者。

正好看到一位印度的AI工程师Manthan Gupta 通过逆向工程拆解了 ChatGPT 的记忆功能。（原文地址：https://manthanguptaa.in/posts/chatgpt_memory/ ）

你会发现大道至简，作为大家公认实现得相对较好的记忆系统，ChatGPT没有用 RAG，而且就几层大家都能想到的信息一起输入：

1.会话元数据：时间、设备、是否付费、活跃度等等

2.当前会话窗口的最新会话和所有历史会话记录（超 token 限制的话截断）

3.跨会话窗口的 15 条左右历史会话摘要，只总结用户提问，不总结模型回答

4.user profile 级别的全局记忆，大概几十条，按照特定要求记录的用户姓名职业兴趣等长期事实，或者用户明确要求记录的东西

以下是原文的详细翻译：

我逆向工程了 ChatGPT 的记忆系统，这是我的发现！

作者：Manthan Gupta | 日期：2025年12月9日

当我询问 ChatGPT 记得关于我的什么信息时，它列出了 33 件事，从我的名字、职业目标到目前的健身习惯。它是如何存储和检索这些信息的？为什么感觉如此无缝？

经过大量的实验，我发现 ChatGPT 的记忆系统比我预期的要简单得多。没有向量数据库。没有基于对话历史的 RAG（检索增强生成）。

相反，它使用了四个独特的层级：适应你环境的会话元数据、长期存储的显式事实、近期聊天的轻量级摘要以及当前对话的滑动窗口。

这篇博客将详细拆解每一层是如何工作的，以及为什么这种方法可能优于传统的检索系统。这里的所有内容都来自于通过对话逆向工程 ChatGPT 的行为。OpenAI 并没有公开这些实现细节。

ChatGPT 的上下文结构 (Context Structure)

在理解记忆之前，重要的是要理解 ChatGPT 在处理每一条消息时接收到的完整上下文。结构如下：

[0] 系统指令 (System Instructions)
[1] 开发者指令 (Developer Instructions)
[2] 会话元数据 (Session Metadata)（临时性的）
[3] 用户记忆 (User Memory)（长期事实）
[4] 近期对话摘要 (Recent Conversations Summary)（过去的聊天，标题 + 片段）
[5] 当前会话消息 (Current Session Messages)（本次聊天）
[6] 你最新的消息

前两个组件定义了高层行为和安全规则，不是本博客的重点。有趣的部分从会话元数据开始。

会话元数据 (Session Metadata)

这些细节在会话开始时注入一次。它们不会被永久存储，也不会成为长期记忆的一部分。这一块包括：

设备类型（桌面/移动端）
浏览器 + 用户代理 (User Agent)
大致位置/时区
订阅等级
使用模式和活动频率
近期模型使用分布
屏幕尺寸、深色模式状态、JS 启用状态等

会话元数据的示例：

Plaintext

Session Metadata: - User subscription: ChatGPT Go - Device: Desktop browser - Browser user-agent: Chrome on macOS (Intel) - Approximate location: India (may be VPN) - Local time: ~16:00 - Account age: ~157 weeks - Recent activity:   - Active 1 day in the last 1   - Active 5 days in the last 7   - Active 18 days in the last 30 - Conversation patterns:   - Average conversation depth: ~14.8 messages   - Average user message length: ~4057 characters   - Model usage distribution:     * 5% gpt-5.1     * 49% gpt-5     * 17% gpt-4o     * 6% gpt-5-a-t-mini     * etc. - Device environment:   - JS enabled   - Dark mode enabled   - Screen size: 900x1440   - Page viewport: 812x1440   - Device pixel ratio: 2.0 - Session duration so far: ~1100 seconds

这些信息帮助模型根据你的环境调整回答，但在会话结束后，这些信息都不会保留。