微信扫码
添加专属顾问
我要投稿
深度对比Manus与Google Deep Research的分析能力,探索AI工具的未来潜力。 核心内容: 1. Manus操作体验与任务完成度分析 2. Google Deep Research与Manus的性能对比 3. 通用型Agent的实现条件和挑战
Manus官方也没有邮件提醒,反正昨天登录就可以使用了。
简单测试对比了一下Google Deep Research with 2.5 Pro的同一主题的研究分析能力。
给了一个很简单的任务“API访问Telegram频道内容”
Manus的操作很夸张,它是直接起了一台ubuntu虚拟机,然后在sandbox里面完成所有的操作,包含控制浏览器和调用命令行工具。
只能说这波太秀了,脑洞大开。
然后是内容的获取,完全是模拟人工浏览网页的信息。
中间直接修改和编辑文件。但是没有给出任务的任何思考过程。
体验下来感觉里面还有诸多的问题。
首先是内容的合规性,manus正式的网站应该估计是不会开放国内使用的,这种代理上网模式太擦边了。
最近也听说他们在和阿里寻求合作。
但如果是以上面演示的那种交互执行逻辑,我感觉和谁联合,联合谁关系不太大。
因为国内各大平台现在都是孤岛,互不相通,不是扫码就是短信验证,想要获取有价值的内容,基本不可能。
再就是虚拟机这种模式,总还是隔了一层,简单处理一下命令可能还行,离生产力还隔了十万八千里,毕竟真正面向用户的工具还是类似Excel,PS,IDE这类实体应用软件,更不要说象文档资源数据的处理,总不可能通过个浏览器来上传下载吧?
整体感受,Manus总结下来就是四个字:“简单粗暴”,至于有没有效,可能任务不同,得到的结论也不一样,对于这个任务来说,其实完成度还可以。
不过再对比Google Deep Research with 2.5 Pro,就真的是小巫见大巫了,完全不是一重量级的。
Manus在起虚拟机一个一个手动点击操作浏览器的时候,Google Deep Research就直接通到自家的数据库了,再加上2.5 Pro的超级上下文,两分钟就出了一个5000字的报告。
差不多一个小型论文都出来了。
现在的Agent都还是假Agent,绝对不是控制个浏览器,爬几个数据,接个模型就是Agent了。
真正的通用型Agent必须有丰富的数据支撑,建立在强大的视觉模型基础上,连接各类生产力工具,实现在实体电脑手机操作系统上的AI操作层,就目前看来,能完成这个通用Agent也只有谷歌这一家了。
53AI,企业落地大模型首选服务商
产品:场景落地咨询+大模型应用平台+行业解决方案
承诺:免费POC验证,效果达标后再合作。零风险落地应用大模型,已交付160+中大型企业
2025-09-13
蚂蚁数科宣布:支持企业客户按大模型应用效果付费
2025-09-13
阿里Qoder IDE进行AI辅助编程的简单验证
2025-09-13
Docling将pdf转markdown以及与AI生态集成
2025-09-13
Claude Code 为何如此强大?Anthropic 万字长文揭秘 AI Agent 工具开发五大“心法”
2025-09-12
从“代码补全”到“知识对齐”:Qoder Repo Wiki 迎来重磅升级
2025-09-12
基于智能体的自适应资损防控体系 - 淘工厂实践(二)
2025-09-12
运维老王:创业第十年,我用Elevo找回内心翻腾的梦想
2025-09-12
大模型可观测1-5-10:发现、定位、恢复的三层能力建设
2025-08-21
2025-06-21
2025-08-21
2025-08-19
2025-06-19
2025-07-29
2025-09-08
2025-08-19
2025-08-20
2025-07-04
2025-09-12
2025-09-11
2025-09-11
2025-09-09
2025-09-09
2025-09-08
2025-09-08
2025-09-07