微信扫码
添加专属顾问
我要投稿
深度解析OpenAI与字节跳动AI战略差异,探索AI技术的最新进展。 核心内容: 1. OpenAI与字节跳动AI布局的多维度对比 2. 两家公司在AI模型领域的最新进展与竞争态势 3. 应用端的差异分析,以及用户感知和工程实践的对比
五个月前,我写了这个公众号的第一篇文章。主题是字节跳动的火山引擎原动力大会,剖析了字节跳动的AI布局。紧接着的第二篇是OpenAI与ByteDance的对比。
当时,我把OpenAI比作一个科学家,始终以引领模型能力为核心目标;把字节跳动比作一个商人,更追求AI在具体应用上的落地。
过去的五个月,AI领域新闻不断。
在模型端,既有OpenAI、Anthropic、Google等头部公司持续推出新版本模型,也有xAI和DeepSeek这样实力雄厚的新入局者。这些公司的模型在Chatbot Arena上你争我赶,轮流坐庄。
在应用端,智能体成为热词。以Manus为首的通用智能体产品和各种垂类专用智能体都吸引了不少目光。
尽管豆包的国内用户量第一AI应用地位受到了Deepseek的挑战,但字节跳动在AI领域的投入以及产品更新迭代方面的领先地位仍然无法撼动。
这篇文章,我会再次从多个维度比较OpenAI和字节跳动。
01
模型
我们先来看模型,毕竟这是一切的基础。
OpenAI下线了一些老模型,并在今年先后推出了o3正式版、o4mini、GPT-4.5(research preview)以及GPT-4.1。
GPT-4o作为原生多模态模型(非多个模型拼接),今年也凭借文生图火出圈,刮起了一阵吉卜力画风的热潮。
虽然在Chatbot Arena上,GPT模型受到了Gemini、Deepseek、Grok的轮番挑战,但始终位于榜单头部。
Chatbot Arena Leaderboard
除了GPT系列模型,OpenAI还拥有文生图模型DALL-E、视频模型Sora、语音模型Whisper等。
豆包大模型家族种类丰富,涵盖各种模态,甚至包括3D模型,这可以从火山引擎上的模型市场一窥究竟。
豆包模型市场
在Deepseek出圈后,字节跳动并没有像腾讯元宝及其他一些厂商一样,在豆包应用中接入Deepseek模型,而是第一时间跟进,推出了自己的推理模型。
在模型API调用的token费用方面,虽然豆包不如Deepseek那般便宜,但与GPT相比仍是数量级的差异。
豆包模型并没有参与Chatbot Arena的模型PK,因此无法用统一标准比较它与其他模型的能力。但根据我的直观感受,豆包模型与GPT存在明显差距。
02
应用
聊完模型,再来看看应用端,应用的差异更能被用户直接感知。同时,不少模型上的不足可以被应用中的工程部分掩盖。
OpenAI的应用主要围绕网页版和手机版的ChatGPT。除了Sora,所有功能都集成在一个页面和应用中。
尽管与初代应用相比,ChatGPT的页面增加了不少功能,但与其他应用(尤其国内应用)相比,仍显得极为克制。
反观豆包,则是另一番景象。
首先,豆包应用的形态更丰富,涵盖网页、浏览器插件、手机App以及桌面应用。桌面版更新频繁,每隔几天就能看到右上角蓝色的新版本提示。
豆包新版本
豆包针对每个细分应用都提供了快捷方式,生怕用户不知道。我就不一一罗列了,可以看下面的截图。
豆包应用功能
此外,还有一些侧边栏的功能,比如基于本地模型的知识库、基于网页生成播客和视频总结等。
本地知识库
网页生成播客
桌面版中还集成了桌面助手、划词器等小组件。如果豆包运行在后台,进行视频会议时会自动弹窗询问是否记录会议,用“如影随形”形容完全不为过。
前两天的版本更新增加了接入其他应用(如Excel)的功能。打开这些应用时,豆包会询问是否要一起工作,可以直接就应用中的内容向豆包提问,也可将豆包的输出直接复制入该应用。
工作伴侣
豆包手机版也增加了不少新功能,最新的一个是视频通话,这是多模态能力的最好展现。ChatGPT在半年前已具备了这个功能。
实际上,字节跳动与AI相关的产品并非只有豆包,我会在后面的章节继续聊。
与ChatGPT相比,豆包在形态和功能上无疑更丰富。但在AI应用的另一个重要维度——记忆上,ChatGPT则更为出众。
我们希望AI能够记住之前聊过的内容,与我们进行更加连贯、个性化的对话。
豆包虽然也能保留历史对话,但无法将对话内容融入新对话中,仅能结合当前窗口有限长度的上下文。如果你问豆包,我们昨天聊了什么,它会回答不知道。
同样的问题,ChatGPT可以一五一十地告诉你,大幅提升聊天体验。这是通过记忆槽以及参考历史聊天记录两项功能实现的。
GPT的Memory
这方面的差异与豆包和GPT模型本身支持的上下文长度有一定关联。
如果要选两个应用最大的区别,或许是收费机制。
ChatGPT虽可以免费使用,甚至无需登录,但免费版在功能和使用次数上都有限制。若想体验完整服务和最强模型能力,则需升级至Plus或Pro版本,前者每月20美金,后者更是高达每月200美金。
而豆包应用几乎完全免费。我所知的唯二例外是生成PPT和视频,下载生成的PPT需跳转至Ai PPT网页付费,而生成视频只有10次试用。
从用户规模看,ChatGPT无疑是全球王者。OpenAI首席执行官萨姆·奥尔特曼在TED 2025大会上透露,ChatGPT的全球用户规模已超过8亿。月活数量估计在4亿。
豆包的月活跃用户刚刚过亿,甚至被Deepseek抢下国内头把交椅(近2亿),不过仍遥遥领先国内第二梯队的腾讯元宝(4100万)和Kimi(1800万)。
03
智能体
2025年AI领域绕不开的话题就是智能体,有人甚至将2025年称为AI智能体元年。
豆包应用自带创建智能体功能,但这与如今所说的能使用工具的智能体不可同日而语。豆包里的智能体仅是通过“人设”定义AI的对话方式。
豆包智能体
字节跳动更为成熟的智能体工具是偏2C的扣子平台和2B的HiAgent平台。这两个平台允许用户搭建具备工作流的智能体,扣子平台上创建的智能体也能在豆包应用中使用。
在Manus这类通用智能体产品问世后,字节紧跟步伐,推出了类似产品——扣子空间。
与扣子不同,用户可以直接使用扣子空间中的智能体,让它完成具体任务。而与Manus最大区别在于,用户可以在扣子空间自行添加不同的MCP Server,使智能体具备更多能力。
扣子空间MCP Server
此外,字节跳动最新的IDE工具Trae也可被用作MCP Client,但更面向于有编程能力的开发人员。
Trae
OpenAI虽没有类似扣子或扣子空间的独立智能体产品,但在智能体领域并非毫无涉足。
事实上,OpenAI早在GPT-4模型中就埋下了Agent能力的种子——通过函数调用和工具使用接口,GPT-4能主动完成任务。
首先是GPTs,简而言之这是用户自定义的GPT。免费用户可以使用别人创建的GPTs,付费用户可以创建自己的GPTs。
在我看来,这是介于豆包智能体和扣子之间的一个产品。在创建GPTs时,用户可以选择它具备哪些能力,如浏览网页、4o作图等。
此外,还可以通过Action赋予GPTs通过api查询外部信息或执行外部操作的能力。
GPTs
虽然在GPTs中用户无法编排工作流,但由于GPT模型本身的强大能力,它可以自主决定许多任务的流程。
除GPTs外,ChatGPT中的DeepResearch可以被看做在调研领域的专用智能体,而Operator更是具备了操作电脑的能力。只是这两项功能都只开放给付费用户。
OpenAI在前不久收购了AI IDE产品Windsurf。与Cursor以及字节跳动的Trae一样,Windsurf支持MCP协议,可以在智能体领域发挥特长。
04
生态
最后简单聊聊生态。
字节跳动可谓自成生态。
豆包并非字节唯一的AI产品。豆包中不少功能都有独立应用,比如生成音乐的海绵音乐、生成图片和视频的即梦、学习的豆包爱学等。当然还有之前提到的扣子、HiAgent、扣子空间、Trae。
字节在许多其它产品中大量加入了AI的能力。
剪映中有大量赋能自媒体工作者的AI功能 —— 图片视频生成、AI配音、数字人、AI特效,等等。
剪映
而在面向企业的办公应用飞书中也可以看到许多AI的身影。妙记的AI会议记录提升会议效率,最近上线的飞书知识问答将所有飞书上的文档瞬间变为可利用LLM进行搜索问答的知识库。
飞书知识问答
而在扣子平台中创建的智能体不但可以对飞书中的文档进行读写,还能被直接做成应用部署到飞书上。
所有这些与字节跳动过去的积累和发展路径不无关系。
而OpenAI成立伊始就聚焦于AI,并没有字节跳动如此丰富的产品线构建自己的生态,而更多需要依靠合作伙伴的支持。
OpenAI最重要的合作伙伴应该就是Microsoft了。从算力支持到应用集成(Bing,Office Copilot等),MIcrosoft是OpenAI可以让GPT在更多应用层触达用户的重要途径。
除此之外,OpenAI也与Apple进行合作,在iPhone中集成了GPT。
与此同时,OpenAI也在积极寻求更加多元化的发展,比如之前提到的对Windsurf的收购。而几天前,OpenAI收购了由苹果前首席设计师Jony Ive创立的AI 硬件公司io,给消费者留下巨大想象空间。
05
写在最后
5个月后,我依然感受到OpenAI和字节跳动之间的巨大差异。
虽然OpenAI在ChatGPT中增加了不少功能,但这些功能更多依靠模型能力的提升(比如gpt-4o的作图)。模型层面的领先和突破仍然是OpenAI的根基。
字节跳动也始终保证自己在模型能力上不掉队,比如在第一时间增加推理模型。但对于应用场景的细分和深度结合依然是字节跳动的立足之本。
与5个月之前一样,我认为在AI进步和普及的道路上,这两类企业缺一不可。
53AI,企业落地大模型首选服务商
产品:场景落地咨询+大模型应用平台+行业解决方案
承诺:免费场景POC验证,效果验证后签署服务协议。零风险落地应用大模型,已交付160+中大型企业
2025-06-05
深入 A2A Protocol:一个 Python 的例子
2025-06-05
DeepSeek R1 0528让我重新思考 AI 编程
2025-06-05
OpenMemory MCP:让AI工具拥有"共享记忆"
2025-06-05
在中国,大模型的应用困境
2025-06-05
Cursor 1.0 震撼发布:AI 编程进入“自动审查 + 记忆”时代!效率飙升 10 倍
2025-06-05
Cursor 1.0 发布:AI 编程的「闭环」时代正式到来
2025-06-05
Deep Search 如何理解业务仓库代码?
2025-06-05
Milvus实战——问答系统
2024-08-13
2024-06-13
2024-08-21
2024-07-31
2024-09-23
2024-05-28
2024-08-04
2024-04-26
2024-07-09
2024-07-20
2025-06-05
2025-06-04
2025-06-04
2025-06-03
2025-06-02
2025-05-31
2025-05-29
2025-05-29