我要投稿

Gemini 3.1 Flash-Lite、GPT-5.3 Instant 发布

发布日期：2026-03-04 15:03:35 浏览次数： 2117

作者：Renee 创业随笔

微信搜一搜，关注“Renee 创业随笔”

Gemini 3.1 Flash-Lite 在展示“速度感”方面，比 GPT-5.3 Instant 最近主打的“对齐与聊天体验优化”更有冲击力。

Gemini 3.1 Flash-Lite 发布

主打“动态思考等级”与极致性价比

Google 发布了 Gemini 3.1 Flash-Lite（Preview），定位为 Gemini 3 系列中：

速度最快
成本最低
适合高并发场景

DeepMind 将其定位为一种 “规模化智能（intelligence at scale）”模型。

核心新特性是Dynamic Thinking Levels（动态思考等级）。开发者可以根据任务复杂度调节模型使用的计算资源：

简单任务 → 低计算量、低延迟
复杂任务 → 更高推理能力

类似于给模型加了一个“思考强度旋钮”。

关键性能指标

Jeff Dean 在 X 上公布了一些核心数据：

指标	数据
输入价格	$0.25 / 百万 tokens
输出价格	$1.50 / 百万 tokens
LMArena Elo	1432
GPQA Diamond	86.9%
首 token 延迟	比 Gemini 2.5 Flash 快 2.5 倍

第三方机构 Artificial Analysis 的测试结果：

1M tokens 上下文
>360 tokens/s 输出速度
平均回答延迟约 5.1 秒

不过他们也指出实际混合成本比 2.5 Flash-Lite 有所上涨。

Arena 排名

根据 LMArena：

Arena	排名
Text Arena	#36
Code Arena	~#35

整体定位性能/成本边界上的一个强竞争点。

社区反应

AI 社区讨论最多的是两个点：

1 命名吐槽

很多人调侃：

Flash-Lite… very funny Google.

2 发布速度太快

Google 发布模型的速度比我测试模型还快。

多模态定位

Google 工程师还强调了 Flash-Lite 的一个实际用途：

“数据管道模型”

即用 Flash-Lite 直接处理各种输入，而不是写解析器。可以直接处理文本、图片、视频、音频、PDF。

这意味着它非常适合：

AI workflow / Agent pipeline。

感觉可以用来做 OpenClaw 小龙虾 🦞的模型。

OpenAI 推出 GPT-5.3 Instant

主打“更自然的聊天”

OpenAI 今天向所有 ChatGPT 用户推出 GPT-5.3 Instant。

这一版本明显是在回应用户对 5.2 的主要抱怨：

过度谨慎
免责声明过多
回答太保守

官方的目标是让模型更自然、更少“说教感”。

官方改进

OpenAI 宣称 GPT-5.3 Instant：

更自然的对话体验
更少无必要拒答
更少防御性免责声明
搜索结合回答更好

幻觉率改善

根据 OpenAI 内部数据：

场景	改善
有搜索	幻觉降低 26.8%
无搜索	幻觉降低 19.7%

API 与 Arena

目前：

API 中已出现 GPT-5.3-chat-latest
LMArena 也已开放测试

开发者可以进行 side-by-side 对比评测。

GPT-5.4 被提前预告

OpenAI 还发布了一条高互动的推文：

“sooner than you think”

暗示 GPT-5.4 即将发布。但这引发了一些疑惑。此前 OpenAI 还表示 5.3 Thinking 和 Pro 版本还会继续推出。所以很多人不确定5.4 是否会提前上线。还有一些人猜测这可能是为了转移近期关于 DoD / NSA 合同争议 的舆论关注。

最后插一个 Anthropic 的收入增长曲线：

另外一个今天看到的数据，还是很震撼的。Anthropic 收入爆炸式增长：一年从 10 亿到 190 亿。刷新整个 AI 行业的纪录。

根据记者 Shirin Ghaffary 披露的数据，Anthropic 的 年度化收入（annualized revenue run rate） 在过去一年几乎呈指数级增长。

收入增长时间线

时间	年化收入
2025 年 1 月	$1B
2025 年 5 月	$3B
2025 年 6 月	$4B
2025 年 8 月	$5B
2025 年 10 月	$7B
2025 年 12 月	10B
2026 年 2 月	$14B
2026 年 3 月	$19B

换句话说：

14 个月增长约 19 倍。

这轮增长发生在一个关键节点：Anthropic 与美国国防部（Pentagon）合作争议。

AI 公司正在进入一个新的阶段：

模型能力 + API + 企业 AI 基础设施 = 超高速商业化。

53AI，企业落地大模型首选服务商

产品：场景落地咨询+大模型应用平台+行业解决方案

承诺：免费POC验证，效果达标后再合作。零风险落地应用大模型，已交付160+中大型企业

相关资讯

2026-06-03

Codex三大重磅更新上线：合并ChatGPT倒计时

2026-06-02

让 Coding Agent 从黑盒到透明：阿里云 Agent 观测审计数据采集实践

2026-06-02

哪些活，该交给Claude Code的 /workflows?

2026-06-02

Step 3.7 Flash：为 Agent 而生的高频引擎

2026-06-01

面向 LLM 的架构设计：什么是真正的 AI Friendly 架构？

2026-06-01

写代码快 10 倍，不等于研发快 10 倍！Google 揭秘 AI 系统级瓶颈

2026-06-01

Anthropic 发布《创始人指南》！教你如何创建一家独角兽企业

2026-06-01

现场即壁垒：OpenAI收购Tomoro背后的FDE战争

联系获取

160+中大型企业正在使用53AI

立即咨询预约演示

把握AI发展的机遇，共同探索、共同进步

2025-01-22

如何打造基于GenAI的员工服务机器人

2025-01-22

热点资讯

Claude Opus 4.7刚刚曝光！Claude Code一夜重构，7x24小时替你打工

2026-04-15

OpenAI Codex CLI 完整使用指南

2026-04-07

刚刚Qwen 3.6 Plus上线预览：1M上下文，阿里Coding/Agent翻身战打响

2026-03-31

2026年国内如何注册 Claude 账号教程

2026-03-13

Claude Code 和 Codex 接入 Figma MCP 保姆级教程

2026-04-07

独家| DeepSeek-V4终于要来了：梁文锋憋半年大招，多模态+长期记忆全面破局

2026-03-17

香港终于能直接用 Gemini 了，内地用户能用上吗？

2026-03-17

编程选GPT-5.4，还是GPT-5.3-Codex？

2026-03-21

GPT5.5来了，最大特点解析

2026-04-24

Claude Opus 4.7 发布，全网最详细解读

2026-04-17

大家都在问

哪些活，该交给Claude Code的 /workflows?

2026-06-02

面向 LLM 的架构设计：什么是真正的 AI Friendly 架构？

2026-06-01

如何使用Codex的Goals机制完成长程任务？

2026-05-26

Codex 的 computer use 功能，为什么这么好用？

2026-05-23

前有用友YonClaw，今有金蝶灵基，中国软件双雄的AI底牌谁能笑到最后？

2026-05-21

Harness Engineering：AI 能在真正"出事会炸"的后端系统里写代码吗？

2026-05-19

谁来给企业端即将大规模入职的Agent盖办公室？

2026-05-09

鹅厂员工觉得好的code模型应该具备什么能力？

2026-05-09

热门标签

内容创作大模型技术个人提效 langchain llamaindex 多模态技术 RAG技术智能客服知识图谱模型微调 RAGFlow coze Dify Fastgpt Bisheng Qanything AI+汽车 AI+金融 AI+工业 AI+培训 AI+SaaS Skill 提示词技巧 AI+电商 AI面试数字员工 ChatBI AI知识库开源大模型智能营销智能硬件 FDE AI+医疗 MaxKB Palantir Glean Openclaw