微信扫码
添加专属顾问
我要投稿
OpenAI o1最大的突破在于推理侧scaling law。
过去LLM性能提升已经因为数据和硬件成本碰到天花板。
因此最近一年多LLM研究聚焦于“self-reward” RL来解决数据瓶颈。找到一些领域,通过自己思考来判断回答是否正确,为Reinforcement Learning提供无限的数据。
哪里有训练数据,哪里就有AI Researcher。最容易的各种数学推理和编程领域有无数的题库可以卷。OpenAI o1应该就是把所有的题库都做了一遍,卷出这样一个模型。
通过RL训练模型不断自己判断的一个重大突破就是模型性能可以通过增加思考时间来提升。
过去很多类似的方法性能提升总是有限,在3、4轮思考之后就碰到瓶颈。o1的RL训练强大之处在于推理侧的性能提升是scalable的,几乎是无限的,思考越长,提升越多。
这给AI发展挖了一个天坑。大家可以开始卷推理侧scaling law了:目测各家都会疯狂卷这个方向,会带来很多新的模型和能力。
? 对于AI从业者,意味着一大波新的机会的到来
每当有技术重要突破的时候,总有一批人抱着怀疑,有一批人会陷入漫长的思考,思考应该做什么。还有一批人快速行动,很快赚到了钱。
o1们带来的推理scaling law会让很多原来不成立的场景成立,原来解决不了的问题能解决了。原来本来已经垄断的细分市场出现新的机会
? o1带来的新的机会在哪?
因为RL训练数据构造的原因,o1的提升在逻辑、数学、编程等领域。写作反而更差。因此可以聚焦于原来需要大量逻辑推理的领域,比如:教育领域、编程领域、数据分析领域,甚至工业设计等。
这些领域的问题都可以重新尝试做一遍。
原来已经被人占领的领域也都有后来者重新尝试的机会。
⌛️ 慢——是不是一个问题
很多人说o1太慢了,没法实际应用。
推荐去研究一下著名的独立开发者danny postma做的headshot pro。headshot pro可能是AI创投领域非常著名的一个AI落地案例,可以说是教科书级别的。
AI帮人拍职场职业照。省去上百美金去线下雇佣职业摄影师照相。只需要手机随便自拍一个,AI就帮你生成最专业的职业照。非常赚钱。
headshot pro第一个版本需要做模型训练,需要用户等到第二天才能拿到照片。现在也需要等2小时。
因此只要能精准的找到提供价值的场景,解决用户痛点,很多时候用户不在乎“等”。
有很多产品设计上的技巧可以帮助解决慢的问题。让用户愿意“等”。
很多场景"对"比”快“重要的多。
#o1 #openaio1 #ai出海 #ai应用
53AI,企业落地大模型首选服务商
产品:场景落地咨询+大模型应用平台+行业解决方案
承诺:免费POC验证,效果达标后再合作。零风险落地应用大模型,已交付160+中大型企业
2025-12-15
治理之智 | 从零和博弈走向长期合作:人工智能版权问题分析与思考
2025-12-15
AgentScope x RocketMQ:打造企业级高可靠 A2A 智能体通信基座
2025-12-15
200k Tokens 的上下文真的够用吗?
2025-12-15
专家知识 x 技术放大:我在B端智能体落地一线的万字真实复盘
2025-12-15
字节AI神操作:AI生成接口自动化测试用例,效率拉满
2025-12-15
解析 Goose:为什么它会进入 AAIF,以及这对 Agentic Runtime 意味着什么
2025-12-15
Palantir的“本体论”:数字世界的底层革命
2025-12-15
Claude Skills|将 Agent 变为领域专家
2025-09-19
2025-10-26
2025-10-02
2025-09-17
2025-09-29
2025-10-07
2025-09-30
2025-11-19
2025-10-20
2025-11-13