2026年5月28日 周四晚上19:30,报名腾讯会议了解“如何转型成为前线部署工程师(FDE)”(限30人)
免费POC, 零成本试错
FDE知识库

FDE知识库

学习大模型的前沿技术与行业落地应用


我要投稿

一个Agent工程师听完VC的2小时播客后想通的事

发布日期:2026-05-27 14:54:06 浏览次数: 1565
作者:阿东玩AI

微信搜一搜,关注“阿东玩AI”

推荐语

这篇来自VC的播客,揭示了AI产品设计与市场判断的深层逻辑,值得每一位AI从业者思考。

核心内容:
1. 高质量反馈的重要性:从“被打脸”中学习
2. Harness与模型的关系:Harness是操作系统,模型是处理器
3. 数据飞轮与Agentic产品的未来潜力

杨芳贤
53AI创始人/腾讯云(TVP)最具价值专家

戴雨森去年底预言2026是"Year of R",现实与回调之年,还清空了所有二级市场股票。半年过去,被打脸了。Anthropic收入暴涨,coding Agent全民普及,他自己也承认看错了。

但我在意的不是打脸本身。我在意的是他怎么复盘,以及复盘过程中冒出来的几个判断。我每天用Claude Code写代码,同时也在做OPC创业,所以他说的很多东西我能直接对上自己的体感。聊几个我觉得值得记下来的。

被打脸是一种高质量反馈信号

戴雨森引用了一句话:Strong Opinions, Weakly Held。

有强观点,但别被自己的话绑死。他说差点因为上次说出去的判断不敢再录播客,后来即刻的瓦总说了一句话把他拉回来了:你要是因为被打脸就不说了,那你才是真被自己的观点绑住了。

我写公众号也遇到过。之前对某个工具下了判断,过两个月发现情况变了。改口吧,怕人说前后矛盾;不改吧,自己心里知道那个判断已经过时了。

后来想通了:判断错了不丢人,不更新判断才丢人。

戴雨森把这个比作模型的强化学习。你得有高质量的反馈信号,市场给你的负反馈,比朋友的客气话管用得多。

Harness是OS,模型是处理器

这个类比是整期播客里我觉得最值得琢磨的。

之前有个流行说法:模型公司就是新一代操作系统。戴雨森不这么看。他觉得模型更像驱动OS的处理器,Harness本身才是OS。

理由很直接:现在越来越多的应用是跟用户的Harness对接,不是直接跟底层模型耦合。

我自己的体验能印证。我在Claude Code里配了一堆skill,写了很长的CLAUDE.md,跑了几个月积累了大量context。现在让我换Codex,我第一反应不是"模型不够好",是"我的配置、我的记忆、我的工作流全在这儿呢"。

==你不会因为AMD出了新CPU就把整个Windows重装一遍。CPU可以换,系统你不想动。==

戴雨森举了几个例子:Claude Code用CLI形态,天然适合AI操作;OpenClaw把agent插进微信和WhatsApp,活在用户最熟的地方;Manus做了sandbox和wider research,比模型公司更早搞出agent swarm。

这些创新全不是模型公司做的。模型公司的研究员会觉得"PPT好不好看不本质",但用户觉得这就是本质。

还有一层戴雨森提到的,我觉得很多人忽略了:Harness带来的数据能反哺模型训练,形成数据飞轮。

为什么普通chatbot没有数据飞轮?因为大多数人跟AI闲聊的内容,对模型来说没什么新知识。但agentic产品不一样,用户是在让agent解决真实问题,每一次任务执行的轨迹——哪些步骤对了、哪些错了、用户怎么纠正的——都是高质量的训练数据。

这意味着做Harness的公司不只是在做"壳",它在积累别人拿不到的数据资产。用的人越多,agent越好用,越好用就越多人用。这个飞轮一旦转起来,后来者很难追。

我的判断:模型能力是必要条件,但Harness决定用户体验的上限。如果你是创业者,Harness层的机会可能比你以为的大得多。

Return问题没解决,只是被下推了一层

这个观点让我停下来想了一会儿。

大家看到Anthropic收入暴涨,觉得AI商业化的问题解决了。戴雨森说没有。Anthropic的收入不是最终回报,是客户的投入。

他拆了一个三步链条:投入 → 产出 → 结果。

  • • 投入:企业买token烧钱
  • • 产出:AI写出来的代码和软件
  • • 结果:这些软件得能卖钱或者降本,产生利润

现在所有人都在拼命投入,因为相信最终有结果。但结果到了吗?

他举了个让我有点扎心的例子:到处都有人说用了agentic coding效率提升十倍。但这么多"十倍"喊出来,去看公司的收入,有没有多出很多新产品、卖给很多新用户?

目前看,没有。

原因也不复杂。移动互联网过去几年停滞,不是因为缺程序员写功能,是不知道该做什么。突然多了十倍工程师,不等于收入涨十倍。

我自己也有这个体感。今年二三月份烧了不少token做各种小项目,说实话很多东西做出来之后没带来什么商业价值。更像是在享受"言出法随"的快感,让AI去干活,自己过了把老板瘾。

==但token烧了就是烧了。两年内赚不回来,大部分公司扛不住。==

戴雨森打了个比方:像个水槽,上面不断有人涌进来尝鲜AI coding,下面也有人觉得没啥用走了。现在进来的人远多于走的人,所以收入还在涨。但你最终得把下面的漏洞堵上。

Agent之间可能出现网络效应

这部分是我觉得最有想象力的。

半年前,你的agent和我的agent没区别,跑的都是同一个模型。但现在不一样了。每个人在自己的Harness里沉淀了不同的context、skill、memory。

同一个任务交给不同人的agent,出来的东西不一样。

戴雨森举了个例子:如果张小珺(播客主持人)的agent沉淀了她所有的访谈准备、提问思路、采访经验,那"请张小珺的agent帮我准备一个采访提纲"就比我自己拿Claude Code生成的好得多。

这里面1000块是token费用,9000块是她agent积累的专有知识的溢价。

这就是一种agent之间的marketplace。你的私有信息沉淀在agent里,它就有了独特的交换价值。

我自己的Claude Code里配了大量关于大模型训练、Agent架构、内容生产的context。如果有一天别人的agent可以"雇佣"我的agent来做特定任务,那这些context本身就是一种资产。这个方向我觉得迟早会有人做出来。

几个我自己的判断

听完这期播客,结合我做工程和创业的经验,有几个想法:

1. AI产品不该追大DAU,该追高质量任务完成率。

戴雨森聊到一个问题:对AI产品来说,大DAU应该成为目标吗?

他的观点是不应该。传统互联网产品追DAU,是因为注意力就是收入(广告模式)。但AI产品每次调用都有成本,一个用户天天来闲聊但不产生价值,对公司来说是亏钱的。

真正该优化的指标是:用户交给agent一个任务,agent能不能把它做完、做对。任务完成率上去了,用户才愿意付更多钱,才有正向循环。

我自己用Claude Code也是这个感受。我不在乎每天打开它多少次,我在乎的是:交给它一个功能,它能不能一次搞定不用我反复改。能搞定,200美金/月我觉得便宜;搞不定,免费我也懒得用。

2. 对个人和小公司来说,现在是黄金窗口。

大公司的瓶颈不是缺程序员,是不知道做什么加上组织效率低。但个人和小公司的瓶颈恰恰是有想法没人做。AI coding解决的正是后者。

3. 你的context就是你的护城河。

CLAUDE.md里的配置也好,跟agent长期协作积累的memory也好,这些东西越来越值钱。它不会被蒸馏进模型里,因为它是你的私有信息。

4. 创新需要刻意练习。

戴雨森提到一个朋友每月烧一万美金token,做了个域名扫描器,每天看哪些域名到期了没人续,然后围绕这些域名做小产品。听着挺奇葩,但这就是在练"做什么"这个能力。

我觉得这个思路对。很多人(包括我)坐拥各种coding agent的订阅,但经常不知道做什么。有无限多的AI程序员等着干活,但"做什么"这个问题,目前还是得人来答。

这可能是AI时代人类最后的、也是最重要的能力:决定做什么。

最后

戴雨森有句话我记住了:作为早期投资人,频繁被打脸是幸福的。一个人总不被打脸,大概率不是因为他永远对,是因为他没在进步。

做内容也一样。写出来的判断可能会错,但不写、不判断、不表达,就永远没有反馈信号。

这期播客的信息量远不止这些。关于"下一个字节跳动不会长得像字节"、关于"AI像外星人来到人类世界的三步走"、关于组织变革和蒸汽机到电动机的类比,每个都值得单独写一篇。

53AI,企业落地大模型首选服务商

产品:场景落地咨询+大模型应用平台+行业解决方案

承诺:免费POC验证,效果达标后再合作。零风险落地应用大模型,已交付160+中大型企业

联系我们

售前咨询
186 6662 7370
预约演示
185 8882 0121

微信扫码

添加专属顾问

回到顶部

加载中...

扫码咨询