微信扫码
添加专属顾问
Meta收购Manus引发热议,但这场"垃圾联姻"背后隐藏着AI圈的三个关键概念:MCP、Skill和Agent。 核心内容: 1. MCP协议如何统一AI工具调用标准 2. Skill作为MCP的简化版应用场景分析 3. 当前Agent技术的局限性及未来发展方向
今天朋友圈被 Meta 收购 Manus 的新闻刷屏了。
与此同时,Anthropic 刚发布了 Claude Skill。
作为一个天天用 Claude Code 干活的人,我来聊聊这几个词到底是什么意思,以及为什么我觉得大部分人都被忽悠了。
━━━━━━━━━━━━━━━━━━━━
◆ 目录
一、MCP:给 AI 装"手"的标准接口
· 为什么 AI 需要调用外部工具?
· MCP 之前:各写各的
· MCP 之后:统一协议
二、Skill:MCP 的傻瓜版
· 本质:打包好的 Tool 商店
· 对谁有用?对谁没用?
三、Agent:2025 年最大的泡沫
· Agent 到底在干嘛?
· 为什么现在的 Agent 都是玩具?
· 概率链崩塌:10 步任务的数学
四、Meta × Manus:废物 + 骗子 = 独角兽
· Manus 是什么?高级按键精灵
· Meta 为什么买它?不是为了智能
· 朋友圈为什么高潮?焦虑经济学
五、真正的"Agent"长什么样?
· 我现在的工作流
· 为什么命令行比图形界面强?
· 结论:你才是那个 Agent
━━━━━━━━━━━━━━━━━━━━
◆ 一、MCP:给 AI 装"手"的标准接口
━━━━━━━━━━━━━━━━━━━━
先说最底层的概念。
MCP = Model Context Protocol,模型上下文协议。
这是 Anthropic 在 2024 年底搞的一个开放标准。
────────────────────
【AI 的手脚问题】
大语言模型(LLM)本质上只会"说话"——你给它文字,它返回文字。
但很多任务需要"动手":
▸ 查数据库
▸ 读本地文件
▸ 调用 API
▸ 执行 Shell 命令
怎么让 AI "动手"?
答案是:Tool Calling(工具调用)。
你给 AI 定义一堆"工具",告诉它:
"这个工具叫 query_database,输入是 SQL 语句,输出是查询结果"
然后 AI 在对话过程中,如果需要查数据库,就会生成一个工具调用请求,你的代码负责执行,再把结果喂回去。
────────────────────
【MCP 之前:各写各的】
问题是:每家 AI 公司的工具定义格式不一样。
▸ OpenAI:用 Function Calling
▸ Anthropic:用 Tool Use
▸ Google:又是另一套
你写了一个"查 GitHub"的工具给 Claude 用,想给 GPT 也用?对不起,得重写一遍。
────────────────────
【MCP 之后:统一协议】
MCP 干的事情就是:定义一个标准格式。
▸ 工具怎么描述(JSON Schema)
▸ 工具怎么调用(请求/响应格式)
▸ 权限怎么管理
这样,你写一个 MCP Server(比如"GitHub 连接器"),理论上所有支持 MCP 的 AI 都能用。
「就像 USB 接口——不管什么设备,插上就能用。」
────────────────────
【MCP 长什么样?一个简单例子】
假设你想让 AI 能查天气。
▸ 第一步:定义工具(JSON Schema)
{
"name": "get_weather",
"description": "查询指定城市的天气",
"input_schema": {
"type": "object",
"properties": {
"city": {
"type": "string",
"description": "城市名称,如 北京、上海"
}
},
"required": ["city"]
}
}
▸ 第二步:AI 调用时会生成这样的请求
{
"tool": "get_weather",
"input": { "city": "北京" }
}
▸ 第三步:你的代码执行真正的查询,返回结果
{
"result": "北京今天晴,气温 -3°C 到 5°C"
}
▸ 第四步:AI 拿到结果,继续对话
就这么简单。MCP 规定的就是这几个 JSON 的格式。
────────────────────
【MCP 的隐藏门槛:模型要专门训练】
MCP 只是个「协议」,定义了 JSON 格式怎么写。
但问题是:「AI 模型要能理解这个格式,才能正确调用工具。」
这不是天生的。模型需要专门训练才能学会:
▸ 什么时候该调用工具(而不是自己瞎编答案)
▸ 调用哪个工具(从几十个工具里选对的)
▸ 参数怎么填(不能把"北京"填到"日期"字段里)
▸ 怎么处理返回结果(整合到回答里)
Claude 说它调用工具时的体验:不是"一个个 token 拼出 JSON",而是"想一下就有了"——整个调用结构像一个完整的动作单元,直接冒出来。
这说明 Anthropic 对 Claude 做过专门的 Tool Calling 训练。这个能力是「本能」,不是「模拟」。
「但其他模型不一定有这个本能。」
▸ 有些开源模型只会聊天,不会调用工具
▸ 有些模型能调用,但经常填错参数、选错工具
▸ 有些模型调用格式跟 MCP 不兼容
所以 MCP 虽然是"开放标准",但实际上:
▸ ✓ Claude、GPT-4 这类顶级模型:支持良好
▸ △ 部分开源模型:需要微调才能用
▸ ✗ 小模型/老模型:基本不支持
「协议是通用的,但能用这个协议的模型是稀缺的。」
────────────────────
【MCP 的价值】
对开发者:
▸ ✓ 工具复用:写一次,到处用
▸ ✓ 生态共享:别人写的工具你也能用
▸ ✓ 标准化:不用学每家的私有格式
对普通人:
▸ ✗ 没用。你又不写代码。
━━━━━━━━━━━━━━━━━━━━
◆ 二、Skill:MCP 的傻瓜版
━━━━━━━━━━━━━━━━━━━━
Anthropic 刚发布的 Claude Skill,本质就是:
「官方帮你写好、帮你部署好的 MCP。」
或者说:MCP 的 App Store 版。
────────────────────
【以前(2024)】
你想让 Claude 连 GitHub,得自己:
1. 写一个 MCP Server(Python/Node.js)
2. 定义工具的 JSON Schema
3. 处理 OAuth 鉴权
4. 部署到某个地方(你的服务器或本地)
5. 配置 Claude 连接这个 Server
对程序员来说是基操,对产品经理来说是天书。
────────────────────
【现在(2025 Skill)】
Anthropic 把这些常用的连接器打包成了"Skill"。
用户点一下"安装 GitHub Skill",Claude 就自动拥有了读取仓库的权限。
不用写代码,不用配置,不用部署。
「就像手机上装 App 一样。」
────────────────────
【为什么不用自己跑 Server 了?】
因为 Anthropic 帮你跑了。
▸ MCP 模式:你自己写 Server,自己部署,自己维护
▸ Skill 模式:Anthropic 在云端跑好了 Server,你只管用
本质上 Skill 背后还是 MCP Server,只是:
▸ 代码是 Anthropic(或第三方开发者)写的
▸ 部署在 Anthropic 的云上
▸ 你只需要授权(比如登录 GitHub),不用管技术细节
「Server 没消失,只是从你家搬到了 Anthropic 家。」
代价是什么?
▸ 你的数据要过 Anthropic 的服务器
▸ 你没法定制 Skill 的行为(人家写死了)
▸ 商店里没有的 Skill,你还是得自己写 MCP Server
────────────────────
【Skill 长什么样?对比 MCP】
同样是"查天气"这个功能:
▸ MCP 方式(程序员):
1. 写一个 Python/Node.js 服务
# weather_server.py
from mcp import Server
server = Server("weather")
@server.tool("get_weather")
def get_weather(city: str):
# 调用天气 API
return f"{city}今天晴,气温 -3°C 到 5°C"
server.run()
2. 部署到你的服务器或本地
3. 配置 Claude 连接这个 Server
▸ Skill 方式(小白):
【网页版 Claude.ai】
1. 打开 Settings > Capabilities > Skills
2. 找到想用的 Skill
3. 打开开关
4. 完事
【Claude Code】
把 Skill 文件夹放到 ~/.claude/skills/ 目录下,自动加载
【API】
请求时加 Beta header,指定要用的 Skill
区别一目了然:
MCP Skill
代码 你写 Anthropic/第三方写
部署 你管 Anthropic 管
定制 随便改 不能改
数据 在你手里 过 Anthropic
适合 程序员 小白
────────────────────
【对谁有用?】
▸ ✓ 产品经理:终于能让 Claude 连上公司的 Notion 了
▸ ✓ 运营人员:可以让 Claude 帮忙发推特、管日程
▸ ✓ 小白用户:点点点就能用
────────────────────
【对谁没用?】
▸ ✗ 程序员:你本来就会写 MCP Server,商店里的 Skill 反而是"僵尸预设"
▸ ✗ 高阶用户:官方 Skill 的提示词会干扰你自己的提示词
────────────────────
【我的判断】
Skill 是给「不会写代码的人」用的义肢。
如果你会写代码,直接用 MCP 自己写私有工具,比用商店的 Skill 更灵活、更可控。
商店里的 Skill 就像预装的 App——能用,但不一定好用。
━━━━━━━━━━━━━━━━━━━━
◆ 三、Agent:2025 年最大的泡沫
━━━━━━━━━━━━━━━━━━━━
现在到了最火的词:Agent。
先给一个定义:
「Agent = AI + 自主决策 + 工具调用 + 循环执行」
普通 AI 聊天:你问一句,它答一句。
Agent:你给一个目标,它自己拆解任务、调用工具、观察结果、继续执行,直到完成。
────────────────────
【Agent 在干嘛?】
一个典型的 Agent 工作流:
1. 用户:"帮我订明天北京到上海的机票,最便宜的"
2. Agent 思考:需要查航班 → 调用"航班查询"工具
3. 工具返回:10 个航班,价格 500-2000
4. Agent 思考:需要比价 → 找到最便宜的
5. Agent 思考:需要下单 → 调用"订票"工具
6. Agent 执行:填写信息、确认支付
7. 返回结果:"已订票,航班 MU5101,500 元"
看起来很美好对吧?
────────────────────
【为什么现在的 Agent 都是玩具?】
问题出在第 2-6 步的每一步。
AI 不是 100% 可靠的。它会:
▸ 理解错误:你说"最便宜",它选了"最快"
▸ 工具调错:该查航班,它去查了酒店
▸ 参数填错:日期写成 2024 年而不是 2025 年
▸ 幻觉:编造一个不存在的航班号
▸ 死循环:卡在某个步骤反复重试
────────────────────
【概率链崩塌:10 步任务的数学】
假设 AI 每一步的成功率是 p。
一个任务需要 10 步。
总成功率 = p^10
▸ 如果 p = 99%(顶级模型):0.99^10 = 90%(还行)
▸ 如果 p = 95%:0.95^10 = 60%(勉强能用)
▸ 如果 p = 90%:0.90^10 = 35%(废了)
▸ 如果 p = 80%:0.80^10 = 10%(纯赌博)
现在市面上的 Agent,用的大多是中等模型(成本考虑),单步成功率大概 80-90%。
10 步任务的成功率:10%-35%。
「换句话说:你让它办事,十次有六七次会搞砸。」
这就是为什么现在的 Agent 只能做简单任务(3-5 步),复杂任务必崩。
────────────────────
【Human-in-the-loop:真正能用的方案】
怎么解决?
答案很简单:别让 AI 完全自主,让人类在关键节点介入。
▸ AI 执行 → 报告进度 → 人类确认 → 继续执行
这叫"Human-in-the-loop"(人在回路中)。
但这就不是"自主 Agent"了,这是"AI 助手"。
「所谓的 Agent 革命,其实是把 AI 助手包装了一个新名字。」
━━━━━━━━━━━━━━━━━━━━
◆ 四、Meta × Manus:废物 + 骗子 = 独角兽
━━━━━━━━━━━━━━━━━━━━
好,现在聊聊今天刷屏的新闻。
Meta 花 20 亿美元收购了 Manus。
────────────────────
【Manus 是什么?】
Manus 是一个"通用 Agent"公司。
创始团队是中国人,公司注册在新加坡——赚中国人的钱,不给中国交税,标准操作。
它的卖点是:让 AI 帮你在电脑上"点点点"——打开网页、填表、订票、发帖。
技术路线:
▸ 底层:套一个大模型(Claude 或 GPT-4)
▸ 中层:写一堆 Prompt 让它"规划任务"
▸ 上层:用 Selenium/Puppeteer 模拟鼠标点击
「本质就是个高级版的按键精灵。」
几个月前它火过一阵,媒体说"中国之光"、"邀请码卖天价"。
但用过的人都知道:它经常点错、卡住、死循环。
因为它底层模型的单步成功率不够高,概率链一长就崩。
────────────────────
【Meta 为什么买它?】
Meta 不是为了"智能"买它。
Meta 想做的是:把这个能力塞进 Ray-Ban 智能眼镜里。
(注:Ray-Ban 是雷朋,眼镜品牌。Meta 跟它合作出了智能眼镜,能拍照、语音助手。)
想象一下:
▸ 你戴着眼镜看一眼海报
▸ 说一句"帮我买票"
▸ AI 自动打开网页、填写信息、完成支付
这是 Meta 的元宇宙 + AI 战略。
它不在乎 Manus 的 Agent 有多智能——它只需要一个能"模拟点击"的壳子。
────────────────────
【朋友圈为什么高潮?】
因为大家看到的是:
▸ "又有人因为 AI 暴富了"
▸ "Meta 这种巨头都入场了"
▸ "是不是风口真的来了"
他们转发的不是技术,是「焦虑」。
▸ 焦虑自己被时代抛弃
▸ 焦虑不懂 AI 会失业
▸ 焦虑错过这波红利
「朋友圈转发量 = 焦虑指数」
────────────────────
【为什么我说是"垃圾联姻"?】
Meta 的 AI 能力(Llama)在顶级智力赛道上是笑话。
▸ Llama 4 被 DeepSeek-V3 按在地上摩擦
▸ 国内很多开发者宁可用 Qwen、DeepSeek、Kimi,也不用 Llama——因为真的不好用
▸ 杨乐村(LeCun,Meta 前首席 AI 科学家,2025 年 11 月离职创业)天天喊"世界模型",自家公司全靠堆 LLM
▸ Meta 走的是"开源倾销"路线,想做 AI 界的安卓,但智商不够
Manus 的 Agent 能力也是玩具级。
▸ 底层套别人的模型
▸ 经常点错、卡住
▸ 复杂任务成功率可能不到 30%
两个都不是顶级玩家,凑一起就成了"独角兽"?
「这不是技术的胜利,是资本的胜利。」
━━━━━━━━━━━━━━━━━━━━
◆ 五、真正的"Agent"长什么样?
━━━━━━━━━━━━━━━━━━━━
说完泡沫,说说真正能用的东西。
────────────────────
【我现在的工作流】
我用 Claude Code(命令行版 Claude)干活。
▸ 我说:"把这个目录下超过 30 天的日志删掉"
▸ Claude 理解意图 → 生成 Shell 命令 → 执行 → 返回结果
这个流程:
用户 → 自然语言 → AI → Shell 命令 → Linux 内核 → 结果
对比 Manus 的流程:
用户 → 自然语言 → AI → 识别屏幕截图 → 模拟鼠标移动 → 点击 → 再截图 → 再识别……
哪个更快、更准、更省资源?
────────────────────
【为什么命令行比图形界面强?】
图形界面(GUI)是给人类用的——人类用眼睛看屏幕很快,但打字很慢。
命令行(CLI)是给机器用的——精准、高效、无歧义。
大语言模型"看屏幕"极其低效:
▸ 截图要转成像素 → 像素要编码成 token → token 数量爆炸
▸ 一张 1080p 截图可能要消耗几千个 token
▸ 而同样的信息用命令行输出,可能只要几十个 token
顺便说一句:即使是最大的 Gemini 3.0,上下文也只有"百万 token"——听起来很多对吧?
换算一下:100 万 token ≈ 几 MB 的文本。一张 1.44MB 的软盘就能装下。
(注:软盘是一种古老的存储介质,容量 1.44MB,比你用过的所有 U 盘都小。现在的年轻人可能没见过。)
「AI 的'记忆'其实小得可怜。」
让 AI 去"看屏幕、点鼠标",就像让一个会说话的人去打手语——能用,但低效。
「AI 本来就会"说"命令,你非要让它"比划",这不是脱裤子放屁吗?」
────────────────────
【你才是那个 Agent】
Manus 之类的 Agent 想做的是:"完全自主,不需要人类干预"。
但我们已经证明了,现在的模型达不到这个要求。
真正能用的方案是:
▸ AI 是"运动神经"——负责执行具体操作
▸ 人类是"大脑皮层"——负责决策和纠错
你不需要一个"自主 Agent",你需要一个「听得懂话的助手」。
而 Claude Code 这种命令行 AI,已经做到了:
▸ 你用自然语言描述意图
▸ 它翻译成精确的命令
▸ 你看结果,决定下一步
「你自己就是那个 Agent。AI 是你的延伸,不是你的替代。」
━━━━━━━━━━━━━━━━━━━━
◆ 总结
━━━━━━━━━━━━━━━━━━━━
【三个词的本质】
▸ MCP:给 AI 装"手"的标准接口协议。对开发者有用。
▸ Skill:MCP 的傻瓜版,打包好的工具商店。对小白有用。
▸ Agent:AI + 自主决策 + 工具调用。概念很美,现实很骨感。
【为什么 Agent 是泡沫】
▸ 单步成功率不够高
▸ 概率链一长就崩
▸ 复杂任务成功率可能不到 30%
【Meta × Manus】
▸ Meta:想做 AI 界的安卓,走倾销路线
▸ Manus:高级按键精灵,技术含量有限
▸ 收购原因:给 Ray-Ban 眼镜找个"点击壳子"
▸ 朋友圈高潮原因:焦虑 + 从众
【真正能用的 AI 工具】
▸ 命令行 AI(Claude Code)> 图形界面 Agent(Manus)
▸ Human-in-the-loop > 完全自主
▸ 你才是那个 Agent,AI 是你的延伸
────────────────────
【最后】
下次看到"Agent"这个词,问两个问题:
1. 单步成功率是多少?
2. 任务需要几步?
然后算一下 p^n。
如果答案小于 50%,那就是玩具。
如果答案大于 90%,那才值得用。
目前市面上大部分 Agent,都是前者。
「真正的智能不是'自己干',是'知道什么时候该问人'。」
现在的 Agent 还没学会这一点。
━━━━━━━━━━━━━━━━━━━━
◆ 附注:名词对照
▸ MCP(Model Context Protocol):模型上下文协议,Anthropic 提出的工具调用标准
▸ Skill:Claude 的"技能商店",打包好的 MCP 工具
▸ Agent:能自主决策和执行任务的 AI 系统
▸ Tool Calling:工具调用,让 AI 调用外部工具的能力
▸ Human-in-the-loop:人在回路中,人类参与 AI 决策过程
▸ CLI:命令行界面
▸ GUI:图形用户界面
53AI,企业落地大模型首选服务商
产品:场景落地咨询+大模型应用平台+行业解决方案
承诺:免费POC验证,效果达标后再合作。零风险落地应用大模型,已交付160+中大型企业
2026-07-01
一文了解|SkillScan 智能体技能安全扫描最佳实践
2026-07-01
协作的逆向演进:从 Agent 逻辑重构团队管理
2026-07-01
港科大郭毅可谈Agentic AI时代的核心命题:人机共生,人不可能退场
2026-07-01
Sonnet 5终于来了,然而Opus 4.8现在有点尴尬
2026-07-01
AI可观测性:Prompt、Tool Call、Trace、Token全链路追踪
2026-07-01
AI Infra 全景图:Agent Framework、调度、编排、沙箱、记忆管理、Tracing 分层拆解
2026-07-01
Claude Science发布:60+科学数据库一个对话搞定
2026-07-01
AI 的向量空间里藏着心理学,这是一场嵌入模型的情绪对决
2026-04-15
2026-04-07
2026-04-07
2026-04-24
2026-04-17
2026-04-05
2026-04-05
2026-04-14
2026-04-24
2026-04-22
欢迎您使用【53AI 官方网站】(以下简称“本网站”或“我们”)。本《会员服务协议》(以下简称“本协议”)是您(以下简称“会员”或“用户”)与【深圳市博思协创网络科技有限公司】之间关于注册、登录及使用本网站会员服务所订立的法律协议。
在您注册或登录前,请务必审慎阅读、充分理解各条款内容,特别是免除或限制责任的条款、知识产权条款、争议解决条款等。此类条款将以加粗形式提示您注意。 当您通过微信公众号授权、手机验证码验证或其他方式成功登录本网站时,即视为您已完全理解并同意接受本协议的全部内容。
一、 定义
本网站:指由【深圳市博思协创网络科技有限公司】运营的,域名为【53ai.com】的网站及相关移动端页面。
会员服务:指本网站向注册会员提供的知识库文章查阅、内容检索及其他相关增值服务。
知识库内容:指本网站发布的包括但不限于文字、图表、数据、研究报告、行业分析等数字化内容资源。
二、 账号注册与登录
登录方式:本网站支持以下登录方式,您可根据实际情况选择:
微信公众号授权登录:您同意将您的微信OpenID信息授权给本网站,用于创建或关联会员账号。
手机验证码登录:您需提供真实有效的手机号码,并通过短信验证码完成身份验证与登录/注册。
账号安全:您的账号仅限您本人使用,禁止赠与、借用、租用、转让或售卖。因您保管不善导致的账号被盗、密码泄露等损失,由您自行承担。
实名认证:根据相关法律法规要求,我们可能要求您在特定功能下完成实名认证。如您拒绝提供,可能无法使用部分或全部服务。
未成年人保护:若您未满18周岁,请在法定监护人的陪同下阅读本协议,并在征得监护人同意后使用本服务。
三、 服务内容与规范
知识库查阅权限:会员登录后,有权按照其会员等级对应的权限范围,在线浏览、检索本网站知识库中的相关文章及内容。
服务变更:我们有权根据业务发展需要,调整、变更或终止部分服务内容,并将以网站公告、公众号消息等方式提前通知。
禁止行为:您在使用服务时不得实施以下行为:
利用技术手段批量爬取、下载、转存知识库内容;
将知识库内容用于商业目的或未经授权地向第三方传播;
干扰本网站正常运行或侵犯其他用户合法权益;
发布违法违规信息或从事违反公序良俗的活动。
四、 知识产权声明
权利归属:本网站知识库中的排版设计、软件代码等内容的知识产权均归【公司全称】或原权利人所有,受《中华人民共和国著作权法》等法律保护。
有限许可:本网站授予会员一项非独占、不可转让、不可转授权的普通许可,仅限于个人学习、研究之目的在线查阅知识库内容。
侵权追责:未经书面许可,任何单位或个人不得以任何形式复制、转载、摘编、镜像、汇编或以其他方式使用上述内容。一经发现,我们保留追究其法律责任的权利。
五、 个人信息保护
我们重视对您个人信息的保护。关于我们如何收集、使用、存储和保护您的个人信息,请单独阅读 《隐私政策》。
您通过微信公众号授权或手机号验证所提供的信息,我们将严格按照《个人信息保护法》的规定处理,仅用于身份识别、服务提供及安全验证等必要用途。
您可以随时通过网站设置或联系客服行使查阅、更正、删除个人信息及撤回授权同意的权利。
六、 免责声明
内容准确性:知识库内容仅供参考,不构成专业建议。我们不对其完整性、准确性、时效性作任何明示或暗示的保证,您应自行判断并承担使用风险。
不可抗力:因自然灾害、政策法规变化、网络故障、第三方平台接口异常(如微信接口维护、运营商短信通道故障)等不可抗力导致的服务中断或延迟,我们不承担违约责任。
第三方链接:本网站可能包含指向第三方网站的链接,该等网站的内容和服务不受我们控制,请您自行甄别风险。
七、 违约责任
如您违反本协议约定,我们有权视情节采取警告、限制功能、暂停服务、注销账号等措施,并保留要求赔偿损失的权利。
如因您的违约行为导致我们遭受行政处罚、第三方索赔或商誉损失,您应承担全部赔偿责任(包括但不限于罚款、赔偿金、律师费、公证费等)。
八、 法律适用与争议解决
本协议的订立、执行和解释均适用中华人民共和国大陆地区法律。
因本协议产生的或与本协议有关的任何争议,双方应友好协商解决;协商不成的,任何一方均可向【公司所在地】有管辖权的人民法院提起诉讼。
九、 其他
本协议构成双方就本服务达成的完整协议,取代此前任何口头或书面约定。
本协议任一条款被认定为无效或不可执行的,不影响其他条款的效力。
我们对本协议享有最终解释权,并在法律允许的范围内保留随时修改的权利。修改后的协议一经公布即生效,继续使用服务即视为同意修订内容。