我要投稿

GPT-5.4据传下周上线！200万上下文窗口+持久化状态，告别频繁遗忘

发布日期：2026-03-02 12:37:29 浏览次数： 2077

作者：新智元

微信搜一搜，关注“新智元”

新智元报道

编辑：艾伦

【新智元导读】OpenAI 意外泄露 GPT-5.4！新版凭 200 万 Tokens 与「状态化 AI」实现跨会话持久记忆，并支持全分辨率视觉直读。AI 将从聊天工具向「全自动代理」进化，彻底重塑工作流并引爆底层硬件内存之战。

近日，OpenAI 的一名工程师在 Codex 的公开 GitHub 仓库中提交了一次代码拉取请求，无意间将「gpt-5.4」这个尚未公布的型号写进了版本判断条件中。

几乎在同一时间，带有「alpha-gpt-5.4」标识的公共模型端点以及下拉菜单截图在社交平台X上疯狂流传。

随后发生的事情极为戏剧化，这些信息仿佛触动了某种内部警报，原帖被火速删除，涉事代码也被强制推送覆盖，悄悄改成了「gpt-5.3-codex」。

这种欲盖弥彰的撤回操作，恰恰打消了外界对「占位符误用」的怀疑，让看客们对新版本提前泄露的猜测可信度更高了。

种种迹象表明，OpenAI 正准备跳过 5.3 版本，酝酿一场足以重置行业格局的突袭。

坊间传闻，这次代际跨越最快将在下周落地。

它试图终结近期大模型领域挤牙膏式的常规更新，直接向对手甩出一张王牌。

结合目前浮出水面的多方情报，这次大版本的核心杀手锏已经呼之欲出。

它抛弃了在常规推理基准测试里与同行近身肉搏的路线，将主战场转移到了内存与上下文架构上。

高达 200 万 Tokens 的上下文窗口配上真正的状态化 AI（Stateful AI），让模型从此摆脱了「金鱼般的记忆」。

它能够在不同的会话之间，完整保留你的工作流、开发环境乃至工具调用状态。

打工人终于不用在每次新建对话时，像复读机一样重新交代冗长的项目背景。

模型会自带这种持久的认知连续性，真正融入用户的日常开发节奏中。

视觉能力的暗中大跃进同样令开发者振奋。

泄露信息中明确提到了一个专门针对「gpt-5.4 及更高版本」的功能开关，该功能允许模型绕过传统的图像压缩机制，直接读取全分辨率的原始字节。

这意味着，前端工程师和设计师可以直接丢给它极其精细的 UI 设计图或复杂的工程原理图，彻底告别过去 AI 对着模糊压缩包一本正经胡说八道的体验，实现像素级的视觉分析。

当 Gemini 3.1 Pro 和 Claude 4.6 还在各项跑分榜单上争夺小数点后几位的优势时，GPT-5.4 的野心在于完成从「聊天机器人」到「全自动代理员工」的身份转换。

它能在后台高度可靠地执行多步复杂任务，把那些号称最先进的竞品衬托得像个带有对话框的高级计算器。

当然，这种级别的上下文和状态保持，也直接点燃了硬件层面的「内存之战」。

海量 KV 缓存的爆炸式增长，让高带宽内存和 SRAM 的调配面临极限挑战，光学互连技术的引入也从理论构想变为了现实需求。

OpenAI 显然已经在底层算力架构上做好了迎接这场风暴的准备。

53AI，企业落地大模型首选服务商

产品：场景落地咨询+大模型应用平台+行业解决方案

承诺：免费POC验证，效果达标后再合作。零风险落地应用大模型，已交付160+中大型企业

相关资讯

2026-05-31

Anthropic的六步闭环，让漏洞无处遁形

2026-05-29

软件架构演化简史：从单体到AI原生

2026-05-29

李开复王小川转身，大模型创业上半场结束

2026-05-29

如何把 Codex 用到极致

2026-05-29

全球Harness驾驭工程发展态势、模式演进与落地挑战分析

2026-05-29

刚刚，Claude Opus 4.8 正式发布！

2026-05-28

谷歌放弃 Gemini CLI，转头用 Go 写了个新玩具 Antigravity CLI

2026-05-28

Claude code云端部署 & 魔改sdk实现http流式调用保姆级教程

联系获取

联系获取

160+中大型企业正在使用53AI

立即咨询预约演示

把握AI发展的机遇，共同探索、共同进步

2025-01-22

如何打造基于GenAI的员工服务机器人

2025-01-22

热点资讯

Claude Opus 4.7刚刚曝光！Claude Code一夜重构，7x24小时替你打工

2026-04-15

OpenAI Codex CLI 完整使用指南

2026-04-07

刚刚Qwen 3.6 Plus上线预览：1M上下文，阿里Coding/Agent翻身战打响

2026-03-31

2026年国内如何注册 Claude 账号教程

2026-03-13

Claude Code 和 Codex 接入 Figma MCP 保姆级教程

2026-04-07

独家| DeepSeek-V4终于要来了：梁文锋憋半年大招，多模态+长期记忆全面破局

2026-03-17

香港终于能直接用 Gemini 了，内地用户能用上吗？

2026-03-17

编程选GPT-5.4，还是GPT-5.3-Codex？

2026-03-21

GPT5.5来了，最大特点解析

2026-04-24

Claude Opus 4.7 发布，全网最详细解读

2026-04-17

大家都在问

如何使用Codex的Goals机制完成长程任务？

2026-05-26

Codex 的 computer use 功能，为什么这么好用？

2026-05-23

前有用友YonClaw，今有金蝶灵基，中国软件双雄的AI底牌谁能笑到最后？

2026-05-21

Harness Engineering：AI 能在真正"出事会炸"的后端系统里写代码吗？

2026-05-19

谁来给企业端即将大规模入职的Agent盖办公室？

2026-05-09

鹅厂员工觉得好的code模型应该具备什么能力？

2026-05-09

Markdown要被抛弃了？Claude Code工程师自曝：我已彻底放弃使用Markdown！团队倾向使用HTML！网友：其他编辑工具会被淘汰吗？

2026-05-09

AI吞噬软件的叙事要分化了？

2026-05-08

热门标签

内容创作大模型技术个人提效 langchain llamaindex 多模态技术 RAG技术智能客服知识图谱模型微调 RAGFlow coze Dify Fastgpt Bisheng Qanything AI+汽车 AI+金融 AI+工业 AI+培训 AI+SaaS Skill 提示词技巧 AI+电商 AI面试数字员工 ChatBI AI知识库开源大模型智能营销智能硬件 FDE AI+医疗 MaxKB Palantir Glean Openclaw

应聘简历请发送至： ceo@53ai.com

联系我们

售前咨询

预约演示

微信扫码

添加专属顾问

回到顶部