我要投稿

OpenAI vs. ByteDance II

发布日期：2025-06-03 12:43:59 浏览次数： 2930

作者：AI慢思考

微信搜一搜，关注“AI慢思考”

五个月前，我写了这个公众号的第一篇文章。主题是字节跳动的火山引擎原动力大会，剖析了字节跳动的AI布局。紧接着的第二篇是OpenAI与ByteDance的对比。

当时，我把OpenAI比作一个科学家，始终以引领模型能力为核心目标；把字节跳动比作一个商人，更追求AI在具体应用上的落地。

过去的五个月，AI领域新闻不断。

在模型端，既有OpenAI、Anthropic、Google等头部公司持续推出新版本模型，也有xAI和DeepSeek这样实力雄厚的新入局者。这些公司的模型在Chatbot Arena上你争我赶，轮流坐庄。

在应用端，智能体成为热词。以Manus为首的通用智能体产品和各种垂类专用智能体都吸引了不少目光。

尽管豆包的国内用户量第一AI应用地位受到了Deepseek的挑战，但字节跳动在AI领域的投入以及产品更新迭代方面的领先地位仍然无法撼动。

这篇文章，我会再次从多个维度比较OpenAI和字节跳动。

01

模型

我们先来看模型，毕竟这是一切的基础。

OpenAI下线了一些老模型，并在今年先后推出了o3正式版、o4mini、GPT-4.5（research preview）以及GPT-4.1。

GPT-4o作为原生多模态模型（非多个模型拼接），今年也凭借文生图火出圈，刮起了一阵吉卜力画风的热潮。

虽然在Chatbot Arena上，GPT模型受到了Gemini、Deepseek、Grok的轮番挑战，但始终位于榜单头部。

Chatbot Arena Leaderboard

除了GPT系列模型，OpenAI还拥有文生图模型DALL-E、视频模型Sora、语音模型Whisper等。

豆包大模型家族种类丰富，涵盖各种模态，甚至包括3D模型，这可以从火山引擎上的模型市场一窥究竟。

豆包模型市场

在Deepseek出圈后，字节跳动并没有像腾讯元宝及其他一些厂商一样，在豆包应用中接入Deepseek模型，而是第一时间跟进，推出了自己的推理模型。

在模型API调用的token费用方面，虽然豆包不如Deepseek那般便宜，但与GPT相比仍是数量级的差异。

豆包模型并没有参与Chatbot Arena的模型PK，因此无法用统一标准比较它与其他模型的能力。但根据我的直观感受，豆包模型与GPT存在明显差距。

02

应用

聊完模型，再来看看应用端，应用的差异更能被用户直接感知。同时，不少模型上的不足可以被应用中的工程部分掩盖。

OpenAI的应用主要围绕网页版和手机版的ChatGPT。除了Sora，所有功能都集成在一个页面和应用中。

尽管与初代应用相比，ChatGPT的页面增加了不少功能，但与其他应用（尤其国内应用）相比，仍显得极为克制。

反观豆包，则是另一番景象。

首先，豆包应用的形态更丰富，涵盖网页、浏览器插件、手机App以及桌面应用。桌面版更新频繁，每隔几天就能看到右上角蓝色的新版本提示。

豆包新版本

豆包针对每个细分应用都提供了快捷方式，生怕用户不知道。我就不一一罗列了，可以看下面的截图。

豆包应用功能

此外，还有一些侧边栏的功能，比如基于本地模型的知识库、基于网页生成播客和视频总结等。

本地知识库

网页生成播客

桌面版中还集成了桌面助手、划词器等小组件。如果豆包运行在后台，进行视频会议时会自动弹窗询问是否记录会议，用“如影随形”形容完全不为过。

前两天的版本更新增加了接入其他应用（如Excel）的功能。打开这些应用时，豆包会询问是否要一起工作，可以直接就应用中的内容向豆包提问，也可将豆包的输出直接复制入该应用。

工作伴侣

豆包手机版也增加了不少新功能，最新的一个是视频通话，这是多模态能力的最好展现。ChatGPT在半年前已具备了这个功能。

实际上，字节跳动与AI相关的产品并非只有豆包，我会在后面的章节继续聊。

与ChatGPT相比，豆包在形态和功能上无疑更丰富。但在AI应用的另一个重要维度——记忆上，ChatGPT则更为出众。

我们希望AI能够记住之前聊过的内容，与我们进行更加连贯、个性化的对话。

豆包虽然也能保留历史对话，但无法将对话内容融入新对话中，仅能结合当前窗口有限长度的上下文。如果你问豆包，我们昨天聊了什么，它会回答不知道。

同样的问题，ChatGPT可以一五一十地告诉你，大幅提升聊天体验。这是通过记忆槽以及参考历史聊天记录两项功能实现的。

GPT的Memory

这方面的差异与豆包和GPT模型本身支持的上下文长度有一定关联。

如果要选两个应用最大的区别，或许是收费机制。

ChatGPT虽可以免费使用，甚至无需登录，但免费版在功能和使用次数上都有限制。若想体验完整服务和最强模型能力，则需升级至Plus或Pro版本，前者每月20美金，后者更是高达每月200美金。

而豆包应用几乎完全免费。我所知的唯二例外是生成PPT和视频，下载生成的PPT需跳转至Ai PPT网页付费，而生成视频只有10次试用。

从用户规模看，ChatGPT无疑是全球王者。OpenAI首席执行官萨姆·奥尔特曼在TED 2025大会上透露，ChatGPT的全球用户规模已超过8亿。月活数量估计在4亿。

豆包的月活跃用户刚刚过亿，甚至被Deepseek抢下国内头把交椅（近2亿），不过仍遥遥领先国内第二梯队的腾讯元宝（4100万）和Kimi（1800万）。

03

智能体

2025年AI领域绕不开的话题就是智能体，有人甚至将2025年称为AI智能体元年。

豆包应用自带创建智能体功能，但这与如今所说的能使用工具的智能体不可同日而语。豆包里的智能体仅是通过“人设”定义AI的对话方式。

豆包智能体

字节跳动更为成熟的智能体工具是偏2C的扣子平台和2B的HiAgent平台。这两个平台允许用户搭建具备工作流的智能体，扣子平台上创建的智能体也能在豆包应用中使用。

在Manus这类通用智能体产品问世后，字节紧跟步伐，推出了类似产品——扣子空间。

与扣子不同，用户可以直接使用扣子空间中的智能体，让它完成具体任务。而与Manus最大区别在于，用户可以在扣子空间自行添加不同的MCP Server，使智能体具备更多能力。

扣子空间MCP Server

此外，字节跳动最新的IDE工具Trae也可被用作MCP Client，但更面向于有编程能力的开发人员。

Trae

OpenAI虽没有类似扣子或扣子空间的独立智能体产品，但在智能体领域并非毫无涉足。

事实上，OpenAI早在GPT-4模型中就埋下了Agent能力的种子——通过函数调用和工具使用接口，GPT-4能主动完成任务。

首先是GPTs，简而言之这是用户自定义的GPT。免费用户可以使用别人创建的GPTs，付费用户可以创建自己的GPTs。

在我看来，这是介于豆包智能体和扣子之间的一个产品。在创建GPTs时，用户可以选择它具备哪些能力，如浏览网页、4o作图等。

此外，还可以通过Action赋予GPTs通过api查询外部信息或执行外部操作的能力。

GPTs

虽然在GPTs中用户无法编排工作流，但由于GPT模型本身的强大能力，它可以自主决定许多任务的流程。

除GPTs外，ChatGPT中的DeepResearch可以被看做在调研领域的专用智能体，而Operator更是具备了操作电脑的能力。只是这两项功能都只开放给付费用户。

OpenAI在前不久收购了AI IDE产品Windsurf。与Cursor以及字节跳动的Trae一样，Windsurf支持MCP协议，可以在智能体领域发挥特长。

04

生态

最后简单聊聊生态。

字节跳动可谓自成生态。

豆包并非字节唯一的AI产品。豆包中不少功能都有独立应用，比如生成音乐的海绵音乐、生成图片和视频的即梦、学习的豆包爱学等。当然还有之前提到的扣子、HiAgent、扣子空间、Trae。

字节在许多其它产品中大量加入了AI的能力。

剪映中有大量赋能自媒体工作者的AI功能 —— 图片视频生成、AI配音、数字人、AI特效，等等。

剪映

而在面向企业的办公应用飞书中也可以看到许多AI的身影。妙记的AI会议记录提升会议效率，最近上线的飞书知识问答将所有飞书上的文档瞬间变为可利用LLM进行搜索问答的知识库。

飞书知识问答

而在扣子平台中创建的智能体不但可以对飞书中的文档进行读写，还能被直接做成应用部署到飞书上。

所有这些与字节跳动过去的积累和发展路径不无关系。

而OpenAI成立伊始就聚焦于AI，并没有字节跳动如此丰富的产品线构建自己的生态，而更多需要依靠合作伙伴的支持。

OpenAI最重要的合作伙伴应该就是Microsoft了。从算力支持到应用集成（Bing，Office Copilot等），MIcrosoft是OpenAI可以让GPT在更多应用层触达用户的重要途径。

除此之外，OpenAI也与Apple进行合作，在iPhone中集成了GPT。

与此同时，OpenAI也在积极寻求更加多元化的发展，比如之前提到的对Windsurf的收购。而几天前，OpenAI收购了由苹果前首席设计师Jony Ive创立的AI 硬件公司io，给消费者留下巨大想象空间。

05

写在最后

5个月后，我依然感受到OpenAI和字节跳动之间的巨大差异。

虽然OpenAI在ChatGPT中增加了不少功能，但这些功能更多依靠模型能力的提升（比如gpt-4o的作图）。模型层面的领先和突破仍然是OpenAI的根基。

字节跳动也始终保证自己在模型能力上不掉队，比如在第一时间增加推理模型。但对于应用场景的细分和深度结合依然是字节跳动的立足之本。

与5个月之前一样，我认为在AI进步和普及的道路上，这两类企业缺一不可。

53AI，企业落地大模型首选服务商

产品：场景落地咨询+大模型应用平台+行业解决方案

承诺：免费POC验证，效果达标后再合作。零风险落地应用大模型，已交付160+中大型企业

相关资讯

2026-06-04

ContextBucket：Agent 的"无限"记忆与工作区底座

2026-06-04

写给 Codex 小白用户的全网最详细教程：从 0 到 1，把它真正用起来

2026-06-03

Kimi Work Beta 版邀你体验：你的工作，分我一半

2026-06-03

实测MiniMax M3，全链路Agent要的三块拼图终于凑齐了

2026-06-03

Agent 越能干，你越不敢放手？ANOLISA给它穿上全套防护

2026-06-03

《审慎部署智能体AI服务》指南

2026-06-03

OpenClaw 和 Hermes 没凉，浅层使用先退场了

2026-06-03

Anthropic突然上线全新CLI：一行命令操控Claude全部API

联系获取

联系获取

160+中大型企业正在使用53AI

立即咨询预约演示

把握AI发展的机遇，共同探索、共同进步

2025-01-22

如何打造基于GenAI的员工服务机器人

2025-01-22

热点资讯

Claude Opus 4.7刚刚曝光！Claude Code一夜重构，7x24小时替你打工

2026-04-15

OpenAI Codex CLI 完整使用指南

2026-04-07

2026年国内如何注册 Claude 账号教程

2026-03-13

刚刚Qwen 3.6 Plus上线预览：1M上下文，阿里Coding/Agent翻身战打响

2026-03-31

Claude Code 和 Codex 接入 Figma MCP 保姆级教程

2026-04-07

独家| DeepSeek-V4终于要来了：梁文锋憋半年大招，多模态+长期记忆全面破局

2026-03-17

香港终于能直接用 Gemini 了，内地用户能用上吗？

2026-03-17

编程选GPT-5.4，还是GPT-5.3-Codex？

2026-03-21

GPT5.5来了，最大特点解析

2026-04-24

Claude Opus 4.7 发布，全网最详细解读

2026-04-17

大家都在问

当 AI 开始拥有“自主调度权”：Claude 4.8 这个新功能，到底有多可怕？

2026-06-03

哪些活，该交给Claude Code的 /workflows?

2026-06-02

面向 LLM 的架构设计：什么是真正的 AI Friendly 架构？

2026-06-01

如何使用Codex的Goals机制完成长程任务？

2026-05-26

Codex 的 computer use 功能，为什么这么好用？

2026-05-23

前有用友YonClaw，今有金蝶灵基，中国软件双雄的AI底牌谁能笑到最后？

2026-05-21

Harness Engineering：AI 能在真正"出事会炸"的后端系统里写代码吗？

2026-05-19

谁来给企业端即将大规模入职的Agent盖办公室？

2026-05-09

热门标签

内容创作大模型技术个人提效 langchain llamaindex 多模态技术 RAG技术智能客服知识图谱模型微调 RAGFlow coze Dify Fastgpt Bisheng Qanything AI+汽车 AI+金融 AI+工业 AI+培训 AI+SaaS Skill 提示词技巧 AI+电商 AI面试数字员工 ChatBI AI知识库开源大模型智能营销智能硬件 FDE AI+医疗 MaxKB Palantir Glean Openclaw

应聘简历请发送至： ceo@53ai.com

联系我们

售前咨询

预约演示

微信扫码

添加专属顾问

回到顶部