支持私有化部署
AI知识库

53AI知识库

学习大模型的前沿技术与行业应用场景


OpenAI vs. ByteDance II

发布日期:2025-06-03 12:43:59 浏览次数: 1628 作者:AI慢思考
推荐语

深度解析OpenAI与字节跳动AI战略差异,探索AI技术的最新进展。

核心内容:
1. OpenAI与字节跳动AI布局的多维度对比
2. 两家公司在AI模型领域的最新进展与竞争态势
3. 应用端的差异分析,以及用户感知和工程实践的对比

杨芳贤
53A创始人/腾讯云(TVP)最具价值专家

五个月前,我写了这个公众号的第一篇文章。主题是字节跳动的火山引擎原动力大会,剖析了字节跳动的AI布局。紧接着的第二篇是OpenAI与ByteDance的对比。

当时,我把OpenAI比作一个科学家,始终以引领模型能力为核心目标;把字节跳动比作一个商人,更追求AI在具体应用上的落地。

过去的五个月,AI领域新闻不断。

在模型端,既有OpenAI、Anthropic、Google等头部公司持续推出新版本模型,也有xAI和DeepSeek这样实力雄厚的新入局者。这些公司的模型在Chatbot Arena上你争我赶,轮流坐庄。

在应用端,智能体成为热词。以Manus为首的通用智能体产品和各种垂类专用智能体都吸引了不少目光。

尽管豆包的国内用户量第一AI应用地位受到了Deepseek的挑战,但字节跳动在AI领域的投入以及产品更新迭代方面的领先地位仍然无法撼动。

这篇文章,我会再次从多个维度比较OpenAI和字节跳动。

01

模型

我们先来看模型,毕竟这是一切的基础。

OpenAI下线了一些老模型,并在今年先后推出了o3正式版、o4mini、GPT-4.5(research preview)以及GPT-4.1。

GPT-4o作为原生多模态模型(非多个模型拼接),今年也凭借文生图火出圈,刮起了一阵吉卜力画风的热潮。

虽然在Chatbot Arena上,GPT模型受到了Gemini、Deepseek、Grok的轮番挑战,但始终位于榜单头部。

  Chatbot Arena Leaderboard

除了GPT系列模型,OpenAI还拥有文生图模型DALL-E、视频模型Sora、语音模型Whisper等。

豆包大模型家族种类丰富,涵盖各种模态,甚至包括3D模型,这可以从火山引擎上的模型市场一窥究竟。

   豆包模型市场

在Deepseek出圈后,字节跳动并没有像腾讯元宝及其他一些厂商一样,在豆包应用中接入Deepseek模型,而是第一时间跟进,推出了自己的推理模型。

在模型API调用的token费用方面,虽然豆包不如Deepseek那般便宜,但与GPT相比仍是数量级的差异

豆包模型并没有参与Chatbot Arena的模型PK,因此无法用统一标准比较它与其他模型的能力。但根据我的直观感受,豆包模型与GPT存在明显差距

02

应用

聊完模型,再来看看应用端,应用的差异更能被用户直接感知。同时,不少模型上的不足可以被应用中的工程部分掩盖。

OpenAI的应用主要围绕网页版和手机版的ChatGPT。除了Sora,所有功能都集成在一个页面和应用中。

尽管与初代应用相比,ChatGPT的页面增加了不少功能,但与其他应用(尤其国内应用)相比,仍显得极为克制

反观豆包,则是另一番景象。

首先,豆包应用的形态更丰富,涵盖网页、浏览器插件、手机App以及桌面应用。桌面版更新频繁,每隔几天就能看到右上角蓝色的新版本提示。

  

豆包新版本

豆包针对每个细分应用都提供了快捷方式,生怕用户不知道。我就不一一罗列了,可以看下面的截图。

豆包应用功能 

此外,还有一些侧边栏的功能,比如基于本地模型的知识库、基于网页生成播客和视频总结等。

   

本地知识库

   

网页生成播客

桌面版中还集成了桌面助手、划词器等小组件。如果豆包运行在后台,进行视频会议时会自动弹窗询问是否记录会议,用“如影随形”形容完全不为过。

前两天的版本更新增加了接入其他应用(如Excel)的功能。打开这些应用时,豆包会询问是否要一起工作,可以直接就应用中的内容向豆包提问,也可将豆包的输出直接复制入该应用。

   

   

工作伴侣

豆包手机版也增加了不少新功能,最新的一个是视频通话,这是多模态能力的最好展现。ChatGPT在半年前已具备了这个功能。

实际上,字节跳动与AI相关的产品并非只有豆包,我会在后面的章节继续聊。

与ChatGPT相比,豆包在形态和功能上无疑更丰富。但在AI应用的另一个重要维度——记忆上,ChatGPT则更为出众

我们希望AI能够记住之前聊过的内容,与我们进行更加连贯、个性化的对话。

豆包虽然也能保留历史对话,但无法将对话内容融入新对话中,仅能结合当前窗口有限长度的上下文。如果你问豆包,我们昨天聊了什么,它会回答不知道。

同样的问题,ChatGPT可以一五一十地告诉你,大幅提升聊天体验。这是通过记忆槽以及参考历史聊天记录两项功能实现的。

   

GPT的Memory

这方面的差异与豆包和GPT模型本身支持的上下文长度有一定关联。

如果要选两个应用最大的区别,或许是收费机制

ChatGPT虽可以免费使用,甚至无需登录,但免费版在功能和使用次数上都有限制。若想体验完整服务和最强模型能力,则需升级至Plus或Pro版本,前者每月20美金,后者更是高达每月200美金。

而豆包应用几乎完全免费。我所知的唯二例外是生成PPT和视频,下载生成的PPT需跳转至Ai PPT网页付费,而生成视频只有10次试用。

从用户规模看,ChatGPT无疑是全球王者。OpenAI首席执行官萨姆·奥尔特曼在TED 2025大会上透露,ChatGPT的全球用户规模已超过8亿。月活数量估计在4亿。

豆包的月活跃用户刚刚过亿,甚至被Deepseek抢下国内头把交椅(近2亿),不过仍遥遥领先国内第二梯队的腾讯元宝(4100万)和Kimi(1800万)。

03

智能体

2025年AI领域绕不开的话题就是智能体,有人甚至将2025年称为AI智能体元年

豆包应用自带创建智能体功能,但这与如今所说的能使用工具的智能体不可同日而语。豆包里的智能体仅是通过“人设”定义AI的对话方式。

   

豆包智能体

字节跳动更为成熟的智能体工具是偏2C的扣子平台和2B的HiAgent平台。这两个平台允许用户搭建具备工作流的智能体,扣子平台上创建的智能体也能在豆包应用中使用。

在Manus这类通用智能体产品问世后,字节紧跟步伐,推出了类似产品——扣子空间

与扣子不同,用户可以直接使用扣子空间中的智能体,让它完成具体任务。而与Manus最大区别在于,用户可以在扣子空间自行添加不同的MCP Server,使智能体具备更多能力。

   

扣子空间MCP Server

此外,字节跳动最新的IDE工具Trae也可被用作MCP Client,但更面向于有编程能力的开发人员。

   

Trae

OpenAI虽没有类似扣子或扣子空间的独立智能体产品,但在智能体领域并非毫无涉足。

事实上,OpenAI早在GPT-4模型中就埋下了Agent能力的种子——通过函数调用和工具使用接口,GPT-4能主动完成任务。

首先是GPTs,简而言之这是用户自定义的GPT。免费用户可以使用别人创建的GPTs,付费用户可以创建自己的GPTs。

在我看来,这是介于豆包智能体和扣子之间的一个产品。在创建GPTs时,用户可以选择它具备哪些能力,如浏览网页、4o作图等。

此外,还可以通过Action赋予GPTs通过api查询外部信息或执行外部操作的能力。

   

GPTs

虽然在GPTs中用户无法编排工作流,但由于GPT模型本身的强大能力,它可以自主决定许多任务的流程。

除GPTs外,ChatGPT中的DeepResearch可以被看做在调研领域的专用智能体,而Operator更是具备了操作电脑的能力。只是这两项功能都只开放给付费用户。

OpenAI在前不久收购了AI IDE产品Windsurf。与Cursor以及字节跳动的Trae一样,Windsurf支持MCP协议,可以在智能体领域发挥特长。

04

生态

最后简单聊聊生态。

字节跳动可谓自成生态

豆包并非字节唯一的AI产品。豆包中不少功能都有独立应用,比如生成音乐的海绵音乐、生成图片和视频的即梦、学习的豆包爱学等。当然还有之前提到的扣子HiAgent扣子空间Trae

字节在许多其它产品中大量加入了AI的能力。

剪映中有大量赋能自媒体工作者的AI功能 —— 图片视频生成、AI配音、数字人、AI特效,等等。

剪映

而在面向企业的办公应用飞书中也可以看到许多AI的身影。妙记的AI会议记录提升会议效率,最近上线的飞书知识问答将所有飞书上的文档瞬间变为可利用LLM进行搜索问答的知识库

   

飞书知识问答

而在扣子平台中创建的智能体不但可以对飞书中的文档进行读写,还能被直接做成应用部署到飞书上。

所有这些与字节跳动过去的积累和发展路径不无关系。

而OpenAI成立伊始就聚焦于AI,并没有字节跳动如此丰富的产品线构建自己的生态,而更多需要依靠合作伙伴的支持。

OpenAI最重要的合作伙伴应该就是Microsoft了。从算力支持应用集成(Bing,Office Copilot等),MIcrosoft是OpenAI可以让GPT在更多应用层触达用户的重要途径。

除此之外,OpenAI也与Apple进行合作,在iPhone中集成了GPT。

与此同时,OpenAI也在积极寻求更加多元化的发展,比如之前提到的对Windsurf的收购。而几天前,OpenAI收购了由苹果前首席设计师Jony Ive创立的AI 硬件公司io,给消费者留下巨大想象空间。

05

写在最后

5个月后,我依然感受到OpenAI和字节跳动之间的巨大差异。

虽然OpenAI在ChatGPT中增加了不少功能,但这些功能更多依靠模型能力的提升(比如gpt-4o的作图)。模型层面的领先和突破仍然是OpenAI的根基

字节跳动也始终保证自己在模型能力上不掉队,比如在第一时间增加推理模型。但对于应用场景的细分和深度结合依然是字节跳动的立足之本

与5个月之前一样,我认为在AI进步和普及的道路上,这两类企业缺一不可


53AI,企业落地大模型首选服务商

产品:场景落地咨询+大模型应用平台+行业解决方案

承诺:免费场景POC验证,效果验证后签署服务协议。零风险落地应用大模型,已交付160+中大型企业

联系我们

售前咨询
186 6662 7370
预约演示
185 8882 0121

微信扫码

添加专属顾问

回到顶部

加载中...

扫码咨询