我要投稿

别让「独立」成为智能体的枷锁

发布日期：2025-05-13 07:29:17 浏览次数： 1730

作者：AI慢思考

微信搜一搜，关注“AI慢思考”

今天继续顺着Manus聊智能体。

这几天，对于Manus的舆论经历了多次反转。甚至还有一个5人团队花了3小时复刻了一个开源版的Manus —— OpenManus。

3月11日，Manus在其中文网站上宣布了与通义的合作。

Manus官网截图

而同一天，OpenAI在最新的产品发布会上推出了几个智能体API以及一套智能体开发SDK。与Manus直接打造通用智能体的路线不同，OpenAI为开发者提供了创建智能体的工具。之前提到过的扣子则是介于两者之间。

Kevin Weil（OpenAI的CPO）在发布会开头如此定义智能体："A system that can act independently to do tasks on your behalf"。在视频结尾，他更是断言："2025 is going to be the year of Agent"。

如果把训练LLM比喻为在大学里通过理论知识培养学生，那么智能体技术就好比让这些大学生步入社会、开始工作。

姑且不论Manus是否通用，先看看它是否真的独立。

旅游规划

Manus官网上有一个旅游规划案例，恰巧最近我正在为家庭旅行制定计划。

一年多前我曾用过GPT制定旅行计划，当时的LLM还没有推理能力。

这次，我先尝试了一些旅游AI应用，比如Layla，但效果并不理想。

随后，我动用了中美8大AI工具来辅助规划——GPT、Claude、Perplexity、Grok、秘塔搜索、腾讯元宝、通义、Get笔记。每一个都是既能上网查资料又会推理的个中好手。

而Manus底层使用的是Claude和通义千问的LLM。

Manus案例的回放视频接近20分钟，概括来说，它首先制定了一个包含7大环节的Todo列表，随后针对不同方面（景点、日语、旅游Tips等）分别进行联网搜索，最后整合信息制定了完整行程，并做成了一份HTML格式的旅行手册。

整个思考过程看似缜密，搜索详尽，最终的旅行手册也颇为惊艳。但以我个人标准评判，这份旅行计划几乎完全不符合实际需求。

我认为问题在于两个字——"信息"。

制定旅游计划基本是一个统筹规划任务。当我们最初形成旅游想法时，存在着无数可能性（或者不确定性），而信息的核心作用就在于减少不确定性。制定旅行计划是不断收集信息、处理信息，逐渐缩小决策空间的过程。

Manus在制定旅行计划时处理的信息量远远不够。

信息匮乏

Manus缺乏的信息大致可以分为两类 —— 用户需求信息和对行程中各个元素的评价。两者同为主观信息。

在Manus的这个案例中，用户需求如下。

Manus官网截图

或许只有ESFP性格类型的人，才会在提供旅行计划需求信息时如此简略，甚至连酒店偏好与餐饮要求都只字未提。不出所料，Manus制定出来的行程中并不包含具体酒店与餐厅的推荐。

我数了一下，在制定计划的过程中Manus进行了11次搜索，每次返回20多个网页，但它似乎每次都只阅读了其中一个。即使假设它阅读了所有内容，总共也不过200多个网页。

当我使用Grok的深度搜索功能制定计划时，它阅读了199个网页，数量级相近。秘塔搜索是参考网页数量最多的，达到515个。而其他的几个AI工具参考的网页数量只有10个左右。

200个网页看似很多，但对于一个国外陌生城市的旅游规划，这些信息对于搜集客观信息或许足够，对于评价性的主观信息却差相去甚远。

比如，酒店地址是客观事实，而酒店好坏则是主观评价；餐厅营业时间是客观信息，食物口味则是主观体验；某个公园有无樱花是客观事实，是否是最佳观赏地点则是主观判断。

个人认为，主观信息对于一份旅行计划的影响远大于客观信息。两类主观信息的匮乏导致AI无法制定出真正符合要求、足够细节的旅行计划。

智能体需要的能力

我认为面对主观信息的匮乏，智能体需具备一些能力。

主动询问

我提供给AI的初版要求也十分简单，但这并非我的全部需求，只是当时就想到这些。需求的完善需要一个过程。

虽然从其他演示视频中看得出，Manus允许用户在它工作时补充信息，但这依赖于用户主动提供。

LLM出现后，不少人认为提问能力是用好LLM的关键。我认为在智能体领域，LLM的提问能力同样是决定智能体优劣的关键。智能体需要足够“聪明”，主动提出好问题，启发用户提供相关信息。

打破信息孤岛

在Manus案例中，它尝试访问TripAdvisor时遇到了人机验证问题，转而查询了其他网站。虽然TripAdvisor的人机验证并不难解决，但这反映了AI可能由于种种原因无法获取某些有用信息。

而在我使用的8大AI工具中，首先有中美的区分。虽然我输入的都是中文指令，但美国AI工具搜索到的都是英文信息。

即便同为中国AI工具，参考的信息也不尽相同。腾讯元宝参考的14篇信息都来自微信公众号，而阿里的通义参考的7篇中有5篇来自于夸克号（同为阿里的产品）。

如今，在中国最被信赖的旅游攻略信息源或许是小红书。即使我明确要求元宝或者通义只参考小红书，它们也无法做到。

而这也是我使用Get笔记的原因。Get笔记可以通过链接将小红书笔记内容转录并存入知识库，这样就能让Get笔记参考这个知识库并利用内嵌的DeepSeek R1制定旅游方案。

信息同步

旅行计划大概率不会一次定稿，直到旅行实际发生之前都还有变化的可能。

当智能体完成了一版旅行计划后，我们依然会主动或被动的接受到与旅行相关的信息。这些信息可能会影响我们的判断、需求、期望等等。

比如，小红书可能推送了一篇旅行目的地的美食笔记，让我们种草了某家餐厅。我们会希望将去这家餐厅用餐融入旅行计划。智能体需要能够及时同步信息修订行程。

此外，家庭旅行通常涉及多人。智能体需要能同步所有人的信息，而无需其中某一人扮演信息的搬运工。

结语

说回到文章开头的问题 —— Manus是否独立。

如果按照Manus的案例展示看，它的确很独立。在输入任务指令后，它可以全程无需人的干预完成一系列操作并给出最终结果。或许这也是很多人对于智能体的幻想，任何事情一键生成。

但对于相对复杂的任务而言，或许智能体本就不应该完全独立。衡量智能体的标准或许不在于它能够一键完成多少不同种类的任务，而是它是否懂得如何与（不同）人配合完成任务。

智能体需要懂事，更需要懂你。

53AI，企业落地大模型首选服务商

产品：场景落地咨询+大模型应用平台+行业解决方案

承诺：免费POC验证，效果达标后再合作。零风险落地应用大模型，已交付160+中大型企业

相关资讯

2025-08-06

Augmodo AI：零售门店智能货架管理平台

2025-08-06

dify案例分享-告别手工录入！Dify 工作流一键生成发票申请预览，对接开票系统超简单

2025-08-01

HiAgent新升级！打造与企业一起成长的智能体工作台

2025-08-01

聪明的AI硬件需要"藏拙"

2025-07-22

iPhone16 接入 Grok 4，国行果粉同步全球最强AI

2025-07-21

Dify v1.6.0：内置双向 MCP 支持

2025-07-08

微信支付这波操作把我干懵了，Agent能赚钱？

2025-07-08

OpenAI 的第一款 AI 硬件，竟然是一支笔？

了解更多

160+中大型企业正在使用53AI

立即咨询预约演示

把握AI发展的机遇，共同探索、共同进步

2025-01-22

如何打造基于GenAI的员工服务机器人

2025-01-22

热点资讯

96G显存的4060？简单聊下AI MAX 395的这颗核显8060s(gfx1151)

2025-05-20

Dify工作流：用爬虫批量把公众号文章存到AI知识库 | 保姆级教程

2025-05-29

Genspark：AI Agent 赛道的差异化突围者 | AI 智能体

2025-05-22

A100、4090、RTX 6000 Ada、RTX 4000 Ada，谁是AI推理时代的真香卡？

2025-05-14

用MCPHub搭建本地自己的MCP平台

2025-05-18

微信支付这波操作把我干懵了，Agent能赚钱？

2025-07-08

Dify结合Echarts实现数据可视化-数据库篇

2025-06-04

CodeBuddy: 腾讯发布智能编程助手，支持生成小程序

2025-05-14

深度研究「AI眼镜」

2025-06-28

“万字拆解”AI智变之道：智能体如何驱动组织进化

2025-05-19

大家都在问

微信支付这波操作把我干懵了，Agent能赚钱？

2025-07-08

OpenAI 的第一款 AI 硬件，竟然是一支笔？

2025-07-08

企业当前适合引入大模型驱动的智能运维吗？

2025-05-27

我们是否应该用 Lite-GPU 构建 AI 集群？

2025-05-24

下一代软件交互：传统应用如何进化成AI Agent？

2025-05-17

A100、4090、RTX 6000 Ada、RTX 4000 Ada，谁是AI推理时代的真香卡？

2025-05-14

如何评测DeepSeek大模型一体机及实现业务价值？

2025-05-12

DeepSeek一体机和Qwen3一体机，选谁？

2025-05-09

热门标签

内容创作大模型技术个人提效 langchain llamaindex 多模态技术 RAG技术智能客服知识图谱模型微调 RAGFlow coze Dify Fastgpt Bisheng Qanything AI+汽车 AI+金融 AI+工业 AI+培训 AI+SaaS 提示词框架提示词技巧 AI+电商 AI面试数字员工 ChatBI 知识管理开源大模型智能营销智能硬件智能化改造 AI+医疗 MaxKB