免费POC, 零成本试错
AI知识库

53AI知识库

学习大模型的前沿技术与行业应用场景


我要投稿

2026年将属于能善用最便宜的Token,解决最脏最累问题的“务实主义者”(长文)

发布日期:2025-12-21 17:52:38 浏览次数: 1519
作者:MediAi

微信搜一搜,关注“MediAi”

推荐语

2026年科技行业将迎来务实主义者的时代,谁能用最低成本解决最棘手问题,谁就能主导市场。

核心内容:
1. 全球科技产业的三层“重构”及其影响
2. 年轻一代与资深老将在AI领域的战略分工
3. 腾讯、小米、Meta等公司的具体转型案例

杨芳贤
53AI创始人/腾讯云(TVP)最具价值专家

随着全球科技产业告别2025年的投机狂热,步入实质性落地阶段,我们观察到市场正经历着深刻的三层“重构”,每一项都潜移默化影响着未来的竞争格局:

  • 首先是高层研究领导者中的人员结构倒置,即“原生AI一代”开始掌舵核心研究,而基础设施层则回归老将治下的成本控制
  • 其次是资本效率危机,以甲骨文(Oracle)股价暴跌为标志,市场首次对债务驱动的扩张模式投下不信任票
  • 最后是技术架构的持续演进,正如Andrej Karpathy在2025年终总结推文中所阐述,行业正从“预训练规模法则”向“可验证奖励强化学习(RLVR)”和“推理时计算(Test-Time Compute)”迈进。

让我们一起从腾讯、小米、Meta等公司引进“Z世代”领导者的战略意图,到亚马逊与苹果在基础设施层面的防御性整合,最后再来看投资人如何重新定义商业模式。

从人才大洗牌看市场战略分流

2025年下半年,全球科技巨头的人事调整呈现出一种极具反差的二元结构。这种调整看似简单的职位轮换,却映射出不同战略下对未来竞争的一致预判:“创造AI”属于年轻人,而“规模化AI”属于老将

“后训练”时代的崛起,30岁以下掌舵者的登场

在中美科技巨头公司中,我们都见证了一场“青春风暴”。这种“巧合”反映出一个技术现实:最新的训练范式,特别是强化学习与Agent推理,更多依赖于对数学直觉和游戏博弈论的理解,而非数十年的传统软件工程经验。这一代研究者是在Transformer架构诞生后成长起来的“AI原住民”,他们对模型行为的直觉往往超越了资深专家。

腾讯:亿元赌注与“Agent优先”

27岁的原OpenAI研究员姚顺雨空降首席AI科学家,直接向总裁刘炽平汇报,既是重金求贤,也同时让组织架构更加扁平化。腾讯意在通过这位Agent专家,越过传统的层级损耗,直接在微信与游戏生态中植入多步推理与工具调用的原生智能。

小米:反向进化与具身智能

DeepSeek研究员罗福莉的加盟,标志着小米拒绝盲目追逐语言模型,转而拥抱“物理智能”。她主导的MiMo-V2-Flash模型以极致的MoE效率(仅激活150亿参数)挑战SOTA,完美契合小米“人x车x家”对边缘计算成本的苛刻要求。

Meta:数据中心论的胜利

通过收购Scale AI并任命28岁的Alexandr Wang为首席AI官,Meta确立了“后训练数据为王”的新秩序。Wang的上位意味着Meta承认,通往AGI的瓶颈已从架构设计转向了大规模数据的清洗与强化学习(RLHF/RLVR)工程。

传统巨头的实用主义回归

与研究端的年轻化相反,基础设施层正在回归老将治下的成本控制。

亚马逊:工程师取代科学家

AWS元老Peter DeSantis接管AGI部门,取代了科学家出身的Rohit Prasad。这一变动标志着亚马逊的战略重心从“探索模型上限”转向“垂直整合”。通过自研Trainium芯片压低推理成本,哪怕牺牲部分通用性,也要在云服务利润战中击败Nvidia的垄断。

苹果:从Siri困境到端侧落地

前Google高管Amar Subramanya替换了掌舵七年的John Giannandrea,宣告了苹果AI告别“学术化与隐私至上”的纠结,全面转向工程落地。Subramanya的任务极其明确,将大模型“暴力压缩”进iPhone的内存限制中,终结Siri的“智障”时代。

表1:2025年Q4全球科技巨头AI负责人变动

另一种视角,草根创业者的机会

与大厂争夺昂贵的“天才少年”不同,金沙江创投的朱啸虎在最近的一期访谈中提出了另一种人才观。他认为在AI应用层,真正的机会可能属于那些在行业中摸爬滚打多年、懂业务痛点的“草根”创业者,甚至是30多岁的行业老兵。他举例提到的“海面舰船清洗机器人”,创始团队并非SOTA模型的发明者,而是能忍受高腐蚀、高浑浊环境,并解决实际清洗问题的工程师。这种“离大厂三条马路”的生存智慧,构成了AI落地应用的另一端。

分歧的资本叙事,华尔街的恐惧与中国创业者的爆发

2025年底的资本市场呈现出一种时空错位的特征:一边是华尔街对“金融空转”的恐惧,另一边是产业界特别是中国创业者对“真实token消耗”的狂热。

华尔街的“甲骨文时刻”,杠杆的破裂

2025年12月,甲骨文(Oracle, ORCL)股价暴跌近19%,这标志着市场对“金融游戏驱动AI基建”模式的认知转折。

循环融资的骗局
Blue Owl Capital退出百亿数据中心项目,揭开了“科技巨头找私募建房,自己回租美化报表”的盖子,市场不再相信这种类似房地产信托(REITs)的游戏。
ROI的拷问
背负2480亿美元租赁承诺的甲骨文,面临的是债权人对“租户风险”的质疑,如果OpenAI们的API调用量不能指数级增长,谁来为这些显卡买单?

朱啸虎:美国的AI估值是中国的100倍,这必定有一端是错的

与华尔街的短期悲观相反,朱啸虎则认为“三年内无泡沫”,他的底气来自于对行业数据的观察:

物理性的短缺
不同于2000年光纤过剩(Dark Fiber),现在的算力短缺是物理层面的。连5-8年前的旧卡都在被压榨,这是真实需求的铁证。
沉默的爆发
中国市场出现了大量“隐形”创业公司,日消耗Token达百亿级。这些公司不讲宏大叙事,只算细账:每天每用户消耗2毛钱Token,广告赚回3毛钱。这种估值与真实的收入/消耗挂钩的增长,与美国的高估值泡沫形成了鲜明对比。
中美估值剪刀差
美国的AI估值是中国的100倍,这必定有一端是错的。朱啸虎认为要么是美国不可持续,要么是中国企业被严重低估。

从“理想主义AGI”到“务实主义超级入口”

技术与产品正在同时经历一场从“仰望星空”到“脚踏实地”的思想转变。如果说Andrej Karpathy在2025年LLM回顾推文中提出了技术的风向标,那朱啸虎则在访谈中展望了产品的最终形态。

在2025年终的推文中,Karpathy宣告了“大力出奇迹”时代的结束,AI将从RLHF演进到RLVR(可验证的奖励),不再依赖昂贵的人类标注,而是依赖客观的验证器(如编译器、数学证明)。这让模型像AlphaGo一样在虚拟环境中自我博弈、自我进化。

朱啸虎则在访谈中提到,Sam Altman在2025年最大的变化是闭口不谈AGI,全力进攻超级入口。ChatGPT推出“群聊”和浏览器,意图就是在抢占用户时长,拼的就是从周活(WAU)到日活(DAU)只有成为像微信一样的“High Duration”应用,才能构建护城河。

DeepSeek在2025年出激发的开源浪潮打破了美国闭源模型的垄断梦,它让全球开发者拥有了对齐GPT-4水平的低成本基座。这迫使所有模型厂商必须在应用层寻找溢价,而非在模型层躺赚API费用。

2026年生存三要素,场景/供应链/垂直数据

在巨头环伺与开源模型的夹击下,2026年的创业生存法则已被彻底改写。软件工程的大众化(Vibe Coding)意味着每个人都可以是产品经理。Lovable和Cursor的爆发证明了未来的应用开发将不再是工程师的特权,而是每个人“表达思想”的舞台,就像如今的短视频一样。

创业者的“死生之地”

对于创业公司,朱啸虎给出了自己的“负面清单”与“生存指南”:

死地(Don't Touch)
大模型与人形机器人:这是巨头的军备竞赛,共识太拥挤,资金门槛太高。
纯工具类:追求模型跑分(SOTA)毫无意义,纯工具类Agent(如写作助手)在大厂OS级整合面前不堪一击。
Club Deal(抱团投资):所有VC都投的项目,注定回报平庸。
生地(The Sweet Spot)
场景足够偏:如海面舰船清洗机器人,环境恶劣(高腐蚀、高浑浊),大厂不愿干,也不懂怎么干。
供应链硬壁垒:利用中国独有的供应链,构建软硬一体的护城河。这是美欧或东南亚无法复制的优势。
垂直数据的闭环:在私有数据可验证的通过率上做到99%,而非通用模型的80%。

在平行交汇中寻找答案

站在新年的门槛上,我们看到的是两个平行宇宙的交汇:美国的“硅谷叙事”和“原生多模态(Google的爆发)”依然很美,但面临资本效率的严峻拷问;中国的“地面部队”(百亿Token消耗的应用、垂直场景的机器人)正在野蛮生长,用极致的性价比验证商业本质。

2026年将属于能善用最便宜的Token,解决最脏最累问题的“务实主义者”


53AI,企业落地大模型首选服务商

产品:场景落地咨询+大模型应用平台+行业解决方案

承诺:免费POC验证,效果达标后再合作。零风险落地应用大模型,已交付160+中大型企业

联系我们

售前咨询
186 6662 7370
预约演示
185 8882 0121

微信扫码

添加专属顾问

回到顶部

加载中...

扫码咨询