微信扫码
添加专属顾问
Manus如何重新定义智能体的价值?从质疑到信服,揭秘它解决的真实世界痛点。 核心内容: 1. 作者对Manus认知的转变过程与关键触发点 2. Manus解决现实世界"脏活累活"的核心能力解析 3. 智能体时代临界点的前瞻性思考
今天是 2025 年的最后一晚,我决定用写文章的方式跨年。
这两天我一直在看 Manus。之前我其实一直对它自称“通用智能体”是存疑的,但现在我慢慢想通了:如果只看对互联网与电脑系统的操作层面,它确实做到了极少数团队能做到的那种通用与可靠。
这一层本身就是极难的工程问题,而 Manus 把它做成了产品级、规模级的能力。
本文把 Manus 到底解决了什么样的脏活累活、又是怎样把这件事做到这个水准的说清楚,并再向前走一步:Manus 之后,智能体时代的临界点在哪!
01
我曾经误解 Manus:我以为“通用”是夸大其词
很长一段时间里,我对 Manus 的态度其实不太客观。
我会下意识把它归到那类“又一个号称通用的 Agent”里:看上去什么都会,真正落地就各种翻车。再加上我自己在做 Agentbase,天然会有一种本能的防御——觉得对方的叙事可能被高估,甚至会不自觉地产生一点嫉妒和不屑。
直到这两天 Meta 20亿美元收购 Manus 的新闻出来,我逼着自己认真看、认真试、认真对照细节,才意识到:我之前那套“先入为主”的批判方式,是错的。
我才意识到,我之前根本没有真正面对现实世界对智能体的第一性需求。
因为我一直盯着“它能不能理解复杂任务”,却没有真正把注意力放到更硬的一层——它到底能不能在现实世界里把事情做完。
现实世界的问题是:“我每天被一堆软件压着,我只想有人替我点完它们。”
现实世界对 agent 的理解是自动进到各种 app 里干活:CRM、ERP、表格、后台、广告投放、报表导出、工单系统。。。这些不是抽象问题,是操作负担。这就是现实用户的第一性原理!
所以:
dify 走的是:workflow + tool calling
Manus 走的是:browser + api + action
他们一旦出来,火爆全球!因为它们在缓解痛感,市场总是先为能缓解当下痛感的东西买单,这是一种非常朴素也非常真实的选择。
Manus 的通用性,恰恰在这一层成立。
Manus 路径是:一看就懂、一试就爽、一用就省事、一付费就心甘情愿!
02
Manus 解决的“脏活累活”,到底是什么?
我现在愿意把这件事说得更直白一点:绝大多数智能体失败,不是失败在聪明,而是失败在手脚。
现实世界的工作并不优雅,它由无数“很烦但必须做”的动作组成:
需要登录、跳转、等待;
页面会变、按钮会换位置、弹窗会出现;
表单会报错、上传会失败、网络会卡;
有的系统根本没有 API,只能靠人点;
很多时候你得在几个系统之间来回切换,复制粘贴,核对字段。
这些东西在 demo 里几乎看不见,但在真实业务里占了 80% 的时间。
Manus 的价值就在这里:它把这类动作层面的“脏活累活”做成了可靠能力,而且不是偶尔成功,是能持续、可重复、可规模化地成功。
我之前最核心的一个疑问是:“Manus 真的通用吗?”
现在我的答案变成:如果把“通用”限定在“对互联网与电脑系统的操作层面”,它确实做到了少数团队才能做到的通用和可靠。
举几个例子:
绝大多数 agent:
会规划
会拆解
会给建议
但一到“进网站 / 登录 / 点按钮 / 填表 / 翻页 / 下载 / 导出”就崩!
Manus 把 最脏、最烦、最容易失败、最不性感 的那一层做到了工业级稳定:这是一种极端偏工程、极端偏 infra、极端偏执行链路可靠性的胜利。
怎么实现的?Manus Cofounder 季逸超点出的关键:
他们不是“多 agent”,而是“同构并行 agent”——Each sub-agent has the same action space as the main agent.
这句话非常重要。意思是:他们不是角色扮演(researcher/planner/critic),而是:N 个完全一样的执行体,并行跑网页、API、表单、数据抓取。拼的是 throughput、容错、调度、重试、幂等。
这是分布式系统工程,不是认知架构设计。
更有意思的是,X 上有位叫陈剑的 90 后币圈玩家(和肖弘差不多大)写了一篇长文分析肖弘的创业史以及为什么他总能点石成金。
“武侠小说中,经常会有一类奇人,他们没有什么花里胡哨的套路,但是就是只把一招练到出神入化,不论走到哪里,都只需要这一招。肖弘就是这样一个人。”
他的总结很直白:“肖弘把 API 集成提效玩到极致。套壳到极致就是牛逼。”
我曾花了 2 年多时间创业只做了一件事:API 集成 Meta 平台的数据,对他的这句话深有体会。这句话在工程语境下等价于:把“最后一公里的摩擦”压到趋近于 0。而这个摩擦,90% 在:
人类浏览器环境
网站登录
奇葩前端
反爬
session
cookie
JS 动态加载
表单校验
导出按钮藏在 5 层菜单里
Manus = 世界上目前最强的“数字苦工 + 数字体力”这一层的极致工程化。而且它有“人为付费”意愿,说明这个苦是真的痛。
03
它也一定有“任务拆解”和“记忆”,只是形态跟我想的不一样
我后来又产生了第二个疑问:
“如果它能做这么多事,它一定也得会拆解任务、也得有记忆吧?那这不就跟我说的 Agentbase 的任务工程很像吗?”
答案是:当然。
一个能稳定执行复杂任务的系统,不可能没有:
任务拆解(把目标变成步骤)
过程记忆(至少要记得自己做到哪)
行为轨迹(否则无法回滚、无法续跑)
判断与重试(否则遇到异常就崩)
否则它不可能:
并行 sub-agent
回滚失败步骤
重试 / 续跑
处理异常
所以是的,它内部一定有类似:
Task representation
Slot filling
Flow control
Trace
Retry / backoff
Success detection
只是这些是它的 engine,不是它的 product。这些结构在 Manus 里,更多是“为了把这次执行跑通”的内部机制,它们是
hardcoded
内部 schema
为他们自己的执行模型服务
会随着产品快速迭代
不保证稳定、不对外承诺
就像:
数据库内部一定有索引、buffer、WAL、GC
但它不会把它们当产品卖
像发动机的零件,强、硬,但不一定对外暴露、也不一定要变成一套公共协议。
我做 Agentbase 时想要的是另一种东西:把这些要素做成可以被看见、被继承、被治理的结构资产。
两者不冲突,只是目标不同。
Manus 改变的是:人 → 电脑 的关系,从 “人点” 变成 “AI 点”。
Agentbase 试图改变的是:人 → 任务 → 组织 的关系,从 “人记住一切” 变成 “系统记住一切”。
这两件事不在同一层级。
Manus 可能成为新的操作入口;
Agentbase 可能成为新的组织内核。
这就是为什么 Manus 被 Meta 收,Agentbase 更像 Snowflake / Palantir 的路径。
04
我还误判了一点:我以为 Manus 强在 API,其实它更难的是“进入不可控世界”
我曾经也想过:“Manus 的强项是不是把 API 玩得很溜?”
后来我意识到:会调 API 的 Agent 其实并不少,真正难的是另一类场景:
没 API 的系统
只能通过 UI 操作的遗留软件
网站频繁改版、状态复杂、容易出错的流程
一堆“人类界面”,天然不欢迎机器
这才是多数智能体的地狱。
正如 Manus 的设计把“Each sub-agent has the same action space.” 这个 action space 包含:
API
Browser
系统调用
表单提交
Manus 最让我佩服的地方,是它把“可控的 API 世界”和“不可控的 UI 世界”当成同一类可调度动作,统一到一个执行空间里,而且能把失败路径也跑通,能继续干活。
这就是为什么它看起来像“制造业”,不是像“互联网”。
05
季逸超那段话,让我彻底对齐了现实:AI 是增幅器,强者会更强
cofounder 季逸超在《manus 决定出售前最后的访谈》说的一段话,我反复读了好几遍:
AI 其实不是平台变化,AI 是技术增幅。以前的优势可以惯性发挥,强者加上 AI,具有先发优势。
从边际成本看,目前为止 AI 更像制造业,而不是像平台:这是非常理智的判断,因为不理智早死了。
它点醒我的地方是:AI 不是天然把机会分给所有人。很多时候它反而让“工程能力强的人”把优势放大。
也解释了为什么 Manus 这么值得尊敬:它不是讲了一个漂亮故事,而是把工程门槛顶到了极致,把“能干活”这件事做成了能力。
我之前对 Manus 的轻视,本质上就是低估了这层工程壁垒。
06
CEO肖弘对 Agent 临界点的判断:先是 Computer Use,然后世界会 API 化
Manus CEO 肖弘最近和腾讯高管访谈中有段对话。
腾讯问“下一次突破口在哪”,肖弘说:
今年或明年初,最大的突破会出现在更通用的 Computer Use——AI 看到一个软件就知道怎么用它。
长期来看,外部环境会越来越 API 化,因为今天的 UI 都是给人类设计的,未来大家会更愿意把能力 API 化给 Agent 用。
这段话把一条路径讲得很清楚:
第一阶段:Agent 先学会用人类的工具和界面(Manus 正在做的事)
第二阶段:世界开始为 Agent 重写接口,越来越 API 化
第三阶段:Agent 会真正变成劳动力,进入组织生产系统
我以前总把“任务结构”放在第一位,忽略了:没有执行层,后面全是空谈。
现在我更愿意承认:Manus 这类公司,是把第一阶段真正打穿的人。
07
当 Agent 真的成为劳动力之后,新的问题才开始出现
看到这里,我也终于想明白了我自己真正关心的那一层。
当 AI 已经能像“数字员工”一样干活时,组织里马上会出现一堆新问题:
一两个人带着上千个 Agent 干活,怎么管?
它们在做什么,谁能看得清?
结果好不好,怎么评估?
哪些策略有效,哪些在浪费钱、制造风险?
怎么复用,怎么迭代,怎么越跑越强?
这不是“让 AI 去点按钮”的问题了,这是组织结构问题。
这也是我最近重新理解“任务为中心”之后,才真正找到的落点:任务必须是一种可以被追踪、被验证、被演化的组织对象。
08
于是我终于能把 Manus 与 Agentbase 放到同一张图上看
我现在更愿意用一种更朴素的表达来理解它们:
Manus 解决的是:让 Agent 先成为可靠的“手”和“脚”,能进到现实世界,能把事情做完。
Agentbase 想解决的是:当这双手脚出现之后,组织如何把它们用好,让它们可管理、可评估、可继承、可进化。
这不是谁取代谁的问题,更像是一条连续的时间轴。
Manus 让第一步发生,后面的结构问题就会被迫浮出水面。
而我真正想做的,是站在 Agent 的视角,把世界看成任务,把“做事”这件事变成可以被组织理解和治理的东西。
这一次我不再用嫉妒和轻视去看 Manus。
我更愿意把它当成一个里程碑:它把智能体必须做的苦活脏活做成了。
它把一个新阶段,从想象推到了现实。
Respect。
53AI,企业落地大模型首选服务商
产品:场景落地咨询+大模型应用平台+行业解决方案
承诺:免费POC验证,效果达标后再合作。零风险落地应用大模型,已交付160+中大型企业
2026-07-02
AI 到底在淘汰谁?一边裁掉 12 万人,一边疯抢 12 年老兵和 24 岁创始人
2026-07-02
一文吃透腾讯 WorkBuddy 全功能:模式、模型、技能、连接器、专家与自动化实操指南
2026-07-01
如何把超级个体的产能,转化成组织能力? | AI跃迁者调研
2026-06-30
我们拿到了企微 AI Agent 的内测资格,提前替你试了一周
2026-06-30
a16z:不要再给Agent标“软件”价格了,AI正式进入劳动力市场!
2026-06-29
Codex 接管群消息后,半小时完成一天的汇总工作
2026-06-29
火山引擎张鑫:企业Agent落地,我们之前忽视了经营问题
2026-06-29
火种&起源:一个运营从0到1搭建CI自动化流水线的实战记录
2026-04-24
2026-04-08
2026-06-08
2026-04-08
2026-05-15
2026-05-15
2026-04-23
2026-04-07
2026-05-06
2026-05-05
2026-06-24
2026-06-24
2026-06-23
2026-06-17
2026-06-10
2026-06-08
2026-05-29
2026-05-27
欢迎您使用【53AI 官方网站】(以下简称“本网站”或“我们”)。本《会员服务协议》(以下简称“本协议”)是您(以下简称“会员”或“用户”)与【深圳市博思协创网络科技有限公司】之间关于注册、登录及使用本网站会员服务所订立的法律协议。
在您注册或登录前,请务必审慎阅读、充分理解各条款内容,特别是免除或限制责任的条款、知识产权条款、争议解决条款等。此类条款将以加粗形式提示您注意。 当您通过微信公众号授权、手机验证码验证或其他方式成功登录本网站时,即视为您已完全理解并同意接受本协议的全部内容。
一、 定义
本网站:指由【深圳市博思协创网络科技有限公司】运营的,域名为【53ai.com】的网站及相关移动端页面。
会员服务:指本网站向注册会员提供的知识库文章查阅、内容检索及其他相关增值服务。
知识库内容:指本网站发布的包括但不限于文字、图表、数据、研究报告、行业分析等数字化内容资源。
二、 账号注册与登录
登录方式:本网站支持以下登录方式,您可根据实际情况选择:
微信公众号授权登录:您同意将您的微信OpenID信息授权给本网站,用于创建或关联会员账号。
手机验证码登录:您需提供真实有效的手机号码,并通过短信验证码完成身份验证与登录/注册。
账号安全:您的账号仅限您本人使用,禁止赠与、借用、租用、转让或售卖。因您保管不善导致的账号被盗、密码泄露等损失,由您自行承担。
实名认证:根据相关法律法规要求,我们可能要求您在特定功能下完成实名认证。如您拒绝提供,可能无法使用部分或全部服务。
未成年人保护:若您未满18周岁,请在法定监护人的陪同下阅读本协议,并在征得监护人同意后使用本服务。
三、 服务内容与规范
知识库查阅权限:会员登录后,有权按照其会员等级对应的权限范围,在线浏览、检索本网站知识库中的相关文章及内容。
服务变更:我们有权根据业务发展需要,调整、变更或终止部分服务内容,并将以网站公告、公众号消息等方式提前通知。
禁止行为:您在使用服务时不得实施以下行为:
利用技术手段批量爬取、下载、转存知识库内容;
将知识库内容用于商业目的或未经授权地向第三方传播;
干扰本网站正常运行或侵犯其他用户合法权益;
发布违法违规信息或从事违反公序良俗的活动。
四、 知识产权声明
权利归属:本网站知识库中的排版设计、软件代码等内容的知识产权均归【公司全称】或原权利人所有,受《中华人民共和国著作权法》等法律保护。
有限许可:本网站授予会员一项非独占、不可转让、不可转授权的普通许可,仅限于个人学习、研究之目的在线查阅知识库内容。
侵权追责:未经书面许可,任何单位或个人不得以任何形式复制、转载、摘编、镜像、汇编或以其他方式使用上述内容。一经发现,我们保留追究其法律责任的权利。
五、 个人信息保护
我们重视对您个人信息的保护。关于我们如何收集、使用、存储和保护您的个人信息,请单独阅读 《隐私政策》。
您通过微信公众号授权或手机号验证所提供的信息,我们将严格按照《个人信息保护法》的规定处理,仅用于身份识别、服务提供及安全验证等必要用途。
您可以随时通过网站设置或联系客服行使查阅、更正、删除个人信息及撤回授权同意的权利。
六、 免责声明
内容准确性:知识库内容仅供参考,不构成专业建议。我们不对其完整性、准确性、时效性作任何明示或暗示的保证,您应自行判断并承担使用风险。
不可抗力:因自然灾害、政策法规变化、网络故障、第三方平台接口异常(如微信接口维护、运营商短信通道故障)等不可抗力导致的服务中断或延迟,我们不承担违约责任。
第三方链接:本网站可能包含指向第三方网站的链接,该等网站的内容和服务不受我们控制,请您自行甄别风险。
七、 违约责任
如您违反本协议约定,我们有权视情节采取警告、限制功能、暂停服务、注销账号等措施,并保留要求赔偿损失的权利。
如因您的违约行为导致我们遭受行政处罚、第三方索赔或商誉损失,您应承担全部赔偿责任(包括但不限于罚款、赔偿金、律师费、公证费等)。
八、 法律适用与争议解决
本协议的订立、执行和解释均适用中华人民共和国大陆地区法律。
因本协议产生的或与本协议有关的任何争议,双方应友好协商解决;协商不成的,任何一方均可向【公司所在地】有管辖权的人民法院提起诉讼。
九、 其他
本协议构成双方就本服务达成的完整协议,取代此前任何口头或书面约定。
本协议任一条款被认定为无效或不可执行的,不影响其他条款的效力。
我们对本协议享有最终解释权,并在法律允许的范围内保留随时修改的权利。修改后的协议一经公布即生效,继续使用服务即视为同意修订内容。