微信扫码
添加专属顾问
我要投稿
OpenAI o1最大的突破在于推理侧scaling law。
过去LLM性能提升已经因为数据和硬件成本碰到天花板。
因此最近一年多LLM研究聚焦于“self-reward” RL来解决数据瓶颈。找到一些领域,通过自己思考来判断回答是否正确,为Reinforcement Learning提供无限的数据。
哪里有训练数据,哪里就有AI Researcher。最容易的各种数学推理和编程领域有无数的题库可以卷。OpenAI o1应该就是把所有的题库都做了一遍,卷出这样一个模型。
通过RL训练模型不断自己判断的一个重大突破就是模型性能可以通过增加思考时间来提升。
过去很多类似的方法性能提升总是有限,在3、4轮思考之后就碰到瓶颈。o1的RL训练强大之处在于推理侧的性能提升是scalable的,几乎是无限的,思考越长,提升越多。
这给AI发展挖了一个天坑。大家可以开始卷推理侧scaling law了:目测各家都会疯狂卷这个方向,会带来很多新的模型和能力。
? 对于AI从业者,意味着一大波新的机会的到来
每当有技术重要突破的时候,总有一批人抱着怀疑,有一批人会陷入漫长的思考,思考应该做什么。还有一批人快速行动,很快赚到了钱。
o1们带来的推理scaling law会让很多原来不成立的场景成立,原来解决不了的问题能解决了。原来本来已经垄断的细分市场出现新的机会
? o1带来的新的机会在哪?
因为RL训练数据构造的原因,o1的提升在逻辑、数学、编程等领域。写作反而更差。因此可以聚焦于原来需要大量逻辑推理的领域,比如:教育领域、编程领域、数据分析领域,甚至工业设计等。
这些领域的问题都可以重新尝试做一遍。
原来已经被人占领的领域也都有后来者重新尝试的机会。
⌛️ 慢——是不是一个问题
很多人说o1太慢了,没法实际应用。
推荐去研究一下著名的独立开发者danny postma做的headshot pro。headshot pro可能是AI创投领域非常著名的一个AI落地案例,可以说是教科书级别的。
AI帮人拍职场职业照。省去上百美金去线下雇佣职业摄影师照相。只需要手机随便自拍一个,AI就帮你生成最专业的职业照。非常赚钱。
headshot pro第一个版本需要做模型训练,需要用户等到第二天才能拿到照片。现在也需要等2小时。
因此只要能精准的找到提供价值的场景,解决用户痛点,很多时候用户不在乎“等”。
有很多产品设计上的技巧可以帮助解决慢的问题。让用户愿意“等”。
很多场景"对"比”快“重要的多。
#o1 #openaio1 #ai出海 #ai应用
53AI,企业落地大模型首选服务商
产品:场景落地咨询+大模型应用平台+行业解决方案
承诺:免费POC验证,效果达标后再合作。零风险落地应用大模型,已交付160+中大型企业
2026-06-29
17 岁高中生做了个假 AI,上线一个月获 2.8 亿次访问
2026-06-29
Loop Engineering 具体做些什么
2026-06-28
字节跳动最新AI Coding实践曝光,我总结了7 条反常识的结论
2026-06-28
企业级AI的核心不是Agent,而是让Agent变得不重要的Skills
2026-06-27
OpenAI深夜引爆GPT-5.6,三箭齐发全面围剿Anthropic
2026-06-27
Agent 发邮件踩坑全记录:从 SMTP 翻车到 Agently Mail
2026-06-27
AgentTeams 和 Claude Tag 都进入群聊模式,是新范式还是新叙事?
2026-06-27
GPT-5.6 Sol深夜炸场发布!OpenAI最强模型碾压Claude 5!
2026-04-15
2026-04-07
2026-04-07
2026-04-24
2026-04-17
2026-03-31
2026-04-05
2026-04-02
2026-04-05
2026-03-31
2026-06-27
2026-06-26
2026-06-25
2026-06-18
2026-06-18
2026-06-10
2026-06-10
2026-06-07