支持私有化部署
AI知识库

53AI知识库

学习大模型的前沿技术与行业应用场景


AI思考新篇 - 技术的舒适区 vs 抽卡

发布日期:2025-06-10 21:57:30 浏览次数: 1545
作者:周喆吾

微信搜一搜,关注“周喆吾”

推荐语

探索AI技术成熟度与商业模式的深度解析。
核心内容:
1. 技术的舒适区在AI产品成功中的作用
2. 抽卡现象与AI技术成熟度的关联
3. 技术进步路径与AI Agent未来展望

杨芳贤
53A创始人/腾讯云(TVP)最具价值专家
  1. 曹曦之前文章用到了一个很好的描述 —— “技术的舒适区”,一般来说成功的公司都是在技术的舒适区里展开商业模式,而不是在技术的绝对前沿。


  2. 要判断 AI 产品是否在技术的舒适区,只需要看是否 “抽卡” —— 意思是可灵/Sora这种在抽卡阶段的模型,用户为了生成一条心仪的片段,需要点很多次 “重新生成” 或 “重新运算”


  3. 我司在美国有一定规模的 AI 娱乐产品的 “regenerate” 按钮使用比例大概是 20%,AI 卡路里产品的更高,而我们营收跑的最好的产品小于 1%


  4. 我们自己没有做 AI 生产力工具,但是据我所知多数产品的抽卡率都还蛮高;有一些聪明的产品直接在结果页面给出4~10条不同的,这和谷歌搜索有异曲同工之妙

     

  5. 我们的判断是,只有在“技术的舒适区”的产品才能踩油门 —— 有两条路:往下走降低技术需求(比如 AI PPT 只有15%是用 AI,其他是模版),或往上走等待技术进步


  6. 技术进步的路径很清晰,Eric Schmidt的斯坦福演讲很明确,只有三点,都是当前 LLM 已经做到但是没有做好的:更长的context、更高的准确性和text-to-action


  7. 草蛇灰线,没有任何大众技术创新是孙猴子从石头缝里蹦出来的,全是已经伏笔多年。2年前提出时惊艳、现在已经比较成熟的多模态和双工实时交互,大家都有一种情理之中的了然,没有看到一个人发出惊叹


  8. 关于更长的context,Dario Amodei 和杨植麟已经讲了很久,也是 Gemini 早就能做到千万级但是由于成本阉割到二百万。Eric说想象一下再加几个数量级能做什么?


  9. 答案是 Harmony,云端同步你的所有文件,最终假设 context 能够比较便宜的覆盖 500GB 级别的文件,似乎就不需要搞那么多RAG脚手架了,多么顺理成章



  10. 更高的准确性,很明确,就是 LangChain 想做到而没起效的。一个每一步推理都会犯错的 LLM 注定是玩具,而一个 SLA 能达到 6个9 的LLM 就可以用来搭建严肃场景的 AI Agent 了


  11. 所以 AI Agent 很明显是提早了的概念,前面那么多公司融资几亿美金做这事情,都是白烧钱空转。一个顶级投资机构的大哥告诉我,硅谷目前一大片都是 Agent 公司,而他们的完成率都在 20% 不到


  12. 这就是本文的主旨:AI Agent在更高的准确性到来之前,显然没有抵达“技术的舒适区”。不论是 Devin、Devon 还是 Magic.dev,不成功就成 Theranos相信他们最终能成功,因为可怜的 Holmes 女士在生物技术世界里没有 Scaling Law)


  13. 最后是 text-to-action,这个事情也是 Stephen Wolfram 两年前就讲清楚的技术必然,只不过由于 Sam Altman 的狂妄自大,所以在 GPTs 非常不合理的产品框架里摔了一跤 —— 还是应该找懂技术的人来带业务啊




  14. 具体来说,不应该是 code interpreter 的实现方式,而是参考这篇论文指出的思路来做文理结合




  15. 举个例子,不论是 GPT-4o 还是 Claude 3.5 还是 Gemini 1.5 Pro,做一个比较基本的计算都能错出一个数量级去,完全不可信;但是换一种方式让他先把问题翻译成Python代码,再起一个环境去运行那段Python代码,并最后读取答案并处理成所需格式,就完美无缺 (截图是我运行的示例)


  16. 这就是 text-to-action 的正确打开方式,今天有一大堆的应用层公司都在搞这个,但是正如 long context 大致取代了 RAG,Meta Llama3 Instruct 大致取代了 SFT,text-to-action必然会进入基模,取代多数的胶水代码

  17. Reid Hoffman 2天前讲到说基本上基模在 GPT-6 这个位置收敛,我觉得估摸着大差不差,就是把之前的多模态和双工实时交互完善一下,然后补齐 长上下文、高准确性、text-to-action,以及顺路降低一些推理成本,工作就大体做完了,我们就会得到 LLM 技术的终极形态了


  18. 这玩意儿由于出色的体能、无限的记忆力和极端变态强大的数理能力也确实有点像 AGI


  19. 应用层的公司,一切的突破口和一的壁垒都在抢占 distribution。正解在于 Workflow Capture! 这个受限于篇幅,下期展开讲


53AI,企业落地大模型首选服务商

产品:场景落地咨询+大模型应用平台+行业解决方案

承诺:免费场景POC验证,效果验证后签署服务协议。零风险落地应用大模型,已交付160+中大型企业

联系我们

售前咨询
186 6662 7370
预约演示
185 8882 0121

微信扫码

添加专属顾问

回到顶部

加载中...

扫码咨询