我要投稿

一个Agent工程师听完VC的2小时播客后想通的事

发布日期：2026-05-27 14:54:06 浏览次数： 1565

作者：阿东玩AI

微信搜一搜，关注“阿东玩AI”

戴雨森去年底预言2026是"Year of R"，现实与回调之年，还清空了所有二级市场股票。半年过去，被打脸了。Anthropic收入暴涨，coding Agent全民普及，他自己也承认看错了。

但我在意的不是打脸本身。我在意的是他怎么复盘，以及复盘过程中冒出来的几个判断。我每天用Claude Code写代码，同时也在做OPC创业，所以他说的很多东西我能直接对上自己的体感。聊几个我觉得值得记下来的。

被打脸是一种高质量反馈信号

戴雨森引用了一句话：Strong Opinions, Weakly Held。

有强观点，但别被自己的话绑死。他说差点因为上次说出去的判断不敢再录播客，后来即刻的瓦总说了一句话把他拉回来了：你要是因为被打脸就不说了，那你才是真被自己的观点绑住了。

我写公众号也遇到过。之前对某个工具下了判断，过两个月发现情况变了。改口吧，怕人说前后矛盾；不改吧，自己心里知道那个判断已经过时了。

后来想通了：判断错了不丢人，不更新判断才丢人。

戴雨森把这个比作模型的强化学习。你得有高质量的反馈信号，市场给你的负反馈，比朋友的客气话管用得多。

Harness是OS，模型是处理器

这个类比是整期播客里我觉得最值得琢磨的。

之前有个流行说法：模型公司就是新一代操作系统。戴雨森不这么看。他觉得模型更像驱动OS的处理器，Harness本身才是OS。

理由很直接：现在越来越多的应用是跟用户的Harness对接，不是直接跟底层模型耦合。

我自己的体验能印证。我在Claude Code里配了一堆skill，写了很长的CLAUDE.md，跑了几个月积累了大量context。现在让我换Codex，我第一反应不是"模型不够好"，是"我的配置、我的记忆、我的工作流全在这儿呢"。

==你不会因为AMD出了新CPU就把整个Windows重装一遍。CPU可以换，系统你不想动。==

戴雨森举了几个例子：Claude Code用CLI形态，天然适合AI操作；OpenClaw把agent插进微信和WhatsApp，活在用户最熟的地方；Manus做了sandbox和wider research，比模型公司更早搞出agent swarm。

这些创新全不是模型公司做的。模型公司的研究员会觉得"PPT好不好看不本质"，但用户觉得这就是本质。

还有一层戴雨森提到的，我觉得很多人忽略了：Harness带来的数据能反哺模型训练，形成数据飞轮。

为什么普通chatbot没有数据飞轮？因为大多数人跟AI闲聊的内容，对模型来说没什么新知识。但agentic产品不一样，用户是在让agent解决真实问题，每一次任务执行的轨迹——哪些步骤对了、哪些错了、用户怎么纠正的——都是高质量的训练数据。

这意味着做Harness的公司不只是在做"壳"，它在积累别人拿不到的数据资产。用的人越多，agent越好用，越好用就越多人用。这个飞轮一旦转起来，后来者很难追。

我的判断：模型能力是必要条件，但Harness决定用户体验的上限。如果你是创业者，Harness层的机会可能比你以为的大得多。

Return问题没解决，只是被下推了一层

这个观点让我停下来想了一会儿。

大家看到Anthropic收入暴涨，觉得AI商业化的问题解决了。戴雨森说没有。Anthropic的收入不是最终回报，是客户的投入。

他拆了一个三步链条：投入 → 产出 → 结果。

• 投入：企业买token烧钱
• 产出：AI写出来的代码和软件
• 结果：这些软件得能卖钱或者降本，产生利润

现在所有人都在拼命投入，因为相信最终有结果。但结果到了吗？

他举了个让我有点扎心的例子：到处都有人说用了agentic coding效率提升十倍。但这么多"十倍"喊出来，去看公司的收入，有没有多出很多新产品、卖给很多新用户？

目前看，没有。

原因也不复杂。移动互联网过去几年停滞，不是因为缺程序员写功能，是不知道该做什么。突然多了十倍工程师，不等于收入涨十倍。

我自己也有这个体感。今年二三月份烧了不少token做各种小项目，说实话很多东西做出来之后没带来什么商业价值。更像是在享受"言出法随"的快感，让AI去干活，自己过了把老板瘾。

==但token烧了就是烧了。两年内赚不回来，大部分公司扛不住。==

戴雨森打了个比方：像个水槽，上面不断有人涌进来尝鲜AI coding，下面也有人觉得没啥用走了。现在进来的人远多于走的人，所以收入还在涨。但你最终得把下面的漏洞堵上。

Agent之间可能出现网络效应

这部分是我觉得最有想象力的。

半年前，你的agent和我的agent没区别，跑的都是同一个模型。但现在不一样了。每个人在自己的Harness里沉淀了不同的context、skill、memory。

同一个任务交给不同人的agent，出来的东西不一样。

戴雨森举了个例子：如果张小珺（播客主持人）的agent沉淀了她所有的访谈准备、提问思路、采访经验，那"请张小珺的agent帮我准备一个采访提纲"就比我自己拿Claude Code生成的好得多。

这里面1000块是token费用，9000块是她agent积累的专有知识的溢价。

这就是一种agent之间的marketplace。你的私有信息沉淀在agent里，它就有了独特的交换价值。

我自己的Claude Code里配了大量关于大模型训练、Agent架构、内容生产的context。如果有一天别人的agent可以"雇佣"我的agent来做特定任务，那这些context本身就是一种资产。这个方向我觉得迟早会有人做出来。

几个我自己的判断

听完这期播客，结合我做工程和创业的经验，有几个想法：

1. AI产品不该追大DAU，该追高质量任务完成率。

戴雨森聊到一个问题：对AI产品来说，大DAU应该成为目标吗？

他的观点是不应该。传统互联网产品追DAU，是因为注意力就是收入（广告模式）。但AI产品每次调用都有成本，一个用户天天来闲聊但不产生价值，对公司来说是亏钱的。

真正该优化的指标是：用户交给agent一个任务，agent能不能把它做完、做对。任务完成率上去了，用户才愿意付更多钱，才有正向循环。

我自己用Claude Code也是这个感受。我不在乎每天打开它多少次，我在乎的是：交给它一个功能，它能不能一次搞定不用我反复改。能搞定，200美金/月我觉得便宜；搞不定，免费我也懒得用。

2. 对个人和小公司来说，现在是黄金窗口。

大公司的瓶颈不是缺程序员，是不知道做什么加上组织效率低。但个人和小公司的瓶颈恰恰是有想法没人做。AI coding解决的正是后者。

3. 你的context就是你的护城河。

CLAUDE.md里的配置也好，跟agent长期协作积累的memory也好，这些东西越来越值钱。它不会被蒸馏进模型里，因为它是你的私有信息。

4. 创新需要刻意练习。

戴雨森提到一个朋友每月烧一万美金token，做了个域名扫描器，每天看哪些域名到期了没人续，然后围绕这些域名做小产品。听着挺奇葩，但这就是在练"做什么"这个能力。

我觉得这个思路对。很多人（包括我）坐拥各种coding agent的订阅，但经常不知道做什么。有无限多的AI程序员等着干活，但"做什么"这个问题，目前还是得人来答。

这可能是AI时代人类最后的、也是最重要的能力：决定做什么。

最后

戴雨森有句话我记住了：作为早期投资人，频繁被打脸是幸福的。一个人总不被打脸，大概率不是因为他永远对，是因为他没在进步。

做内容也一样。写出来的判断可能会错，但不写、不判断、不表达，就永远没有反馈信号。

这期播客的信息量远不止这些。关于"下一个字节跳动不会长得像字节"、关于"AI像外星人来到人类世界的三步走"、关于组织变革和蒸汽机到电动机的类比，每个都值得单独写一篇。

53AI，企业落地大模型首选服务商

产品：场景落地咨询+大模型应用平台+行业解决方案

承诺：免费POC验证，效果达标后再合作。零风险落地应用大模型，已交付160+中大型企业

相关资讯

2026-05-27

我把 OpenAI Codex 官方案例全跑了一遍

2026-05-27

考虑把 Claude Code 全量切换到 Grok Build 了

2026-05-27

从透明开发到系统工程：AgentScope 2.0 发布

2026-05-27

大神Karpathy 发明 autoresearch，仅用 Markdown 就做出了自动化研究循环

2026-05-27

Claude Code 新安全插件：写代码时先拦漏洞

2026-05-26

Routa 桌面版发布：内建 Harness 工程的 AI Coding 研发协作工作台

2026-05-26

面壁智能BitCPM-CANN：端侧AI的内存革命

2026-05-26

AI Native 企业的关键，是从外化到内生

联系获取

160+中大型企业正在使用53AI

立即咨询预约演示

把握AI发展的机遇，共同探索、共同进步

2025-01-22

如何打造基于GenAI的员工服务机器人

2025-01-22

热点资讯

Claude Opus 4.7刚刚曝光！Claude Code一夜重构，7x24小时替你打工

2026-04-15

OpenAI Codex CLI 完整使用指南

2026-04-07

刚刚Qwen 3.6 Plus上线预览：1M上下文，阿里Coding/Agent翻身战打响

2026-03-31

2026年国内如何注册 Claude 账号教程

2026-03-13

Claude Code 和 Codex 接入 Figma MCP 保姆级教程

2026-04-07

独家| DeepSeek-V4终于要来了：梁文锋憋半年大招，多模态+长期记忆全面破局

2026-03-17

香港终于能直接用 Gemini 了，内地用户能用上吗？

2026-03-17

编程选GPT-5.4，还是GPT-5.3-Codex？

2026-03-21

GPT5.5来了，最大特点解析

2026-04-24

刚刚，GPT-5.4 发布，百万上下文、最强全能模型

2026-03-06

大家都在问

如何使用Codex的Goals机制完成长程任务？

2026-05-26

Codex 的 computer use 功能，为什么这么好用？

2026-05-23

前有用友YonClaw，今有金蝶灵基，中国软件双雄的AI底牌谁能笑到最后？

2026-05-21

Harness Engineering：AI 能在真正"出事会炸"的后端系统里写代码吗？

2026-05-19

谁来给企业端即将大规模入职的Agent盖办公室？

2026-05-09

鹅厂员工觉得好的code模型应该具备什么能力？

2026-05-09

Markdown要被抛弃了？Claude Code工程师自曝：我已彻底放弃使用Markdown！团队倾向使用HTML！网友：其他编辑工具会被淘汰吗？

2026-05-09

AI吞噬软件的叙事要分化了？

2026-05-08

热门标签

内容创作大模型技术个人提效 langchain llamaindex 多模态技术 RAG技术智能客服知识图谱模型微调 RAGFlow coze Dify Fastgpt Bisheng Qanything AI+汽车 AI+金融 AI+工业 AI+培训 AI+SaaS Skill 提示词技巧 AI+电商 AI面试数字员工 ChatBI AI知识库开源大模型智能营销智能硬件 FDE AI+医疗 MaxKB Palantir Glean Openclaw