微信扫码
添加专属顾问
我要投稿
Manus虚拟机的全新体验与深入思考,探索AI助理的未来形态。核心内容:1. Manus虚拟机的实际体验与新思考2. AI+虚拟机带来的能力上限与价值3. 虚拟机环境中AI助手的多样化应用案例
因为阴差阳错的一些原因,最近用上了Manus,相较于之前看大部分的use case,自己也上手试了几个场景,以及具体体验了一些对应的功能
发现实际体验之后有了一些新的思考和不一样的感受,所以在之前的那一篇文章的基础上做个补充,也有一些跟之前文章提到的感受和观点不一样的地方,算是一种认知上的迭代的吧,这也是持续记录的好处吧,可以观察自己的思考,觉察自己的思考和路径的问题
这部分其实是Manus的一大特点和甚至叫卖点,我发现在之前的分析中把这部分就随意地滑过去了,没有深入去思考这里面的价值是什么,特别是4月我们又看到一些其他产品形态的Agent的时候,比如从浏览器的形态来切入的Fellou,更加引发了假如一个AI助理有具体的形态和载体,到底应该是个什么?是APP还是浏览器还是一个虚拟机?
虚拟机其实是这个里面最重的,但是也是能力上最全面的,所以也带来了最高的上限。虚拟机其实最核心的能力是两部分,浏览器+代码环境。浏览器解决信息和知识的问题,代码环境解决动手执行和解决具体问题。
这两部分组合之后其实上限是非常高的,我们可能都低估了这个价值。我们想象一下,这不就是你真的把一个非常聪明的实习生请到了你的公司或者家里,你给他配置了电脑,给他讲解了具体的工作环境的感觉嘛。
相较于我们之前用到的chatbot,可能聊天对话更像是一个线上的会议,对面那个人只能“动脑”,而manus是真的把人带到了实际工作和生活的环境中,实现“动脑又动手”。抽象一点说,AI的手脚被放开,可能就只有能耗和权限是限制了
可能还有人没有get到这个差异点,我们在举一些manus实际可能可以做到的例子(AI帮我想的),我们看到很多Agent完成的任务可能都比较静态,比如写一个代码或者网页,或者深度分析和检索一个主题内容等等,这些可能是我们比较容易能想到的
但是实际上,如果AI有了一个虚拟机的环境,它可以做的远远不止这些,比如它可以自己去看第三方的API文档,自己去学习一个新的语言或者工具的使用,自己去调用第三方的API来完成任务,自己去跨越多个不同的网页和环境完成更加复杂的自动化任务的执行
虽然可能上面的例子当前产品层面没办法很好的准确执行,但是确实在AI+虚拟机的架构下给了我们更大的想象空间
我们在思考的科幻一点,是不是理论上AI也可以在虚拟机里面自己去用其他的大模型产品,比如用chatGPT来做deep research,甚至自己去连接服务器去训练模型呢?7*24小时持续迭代自我进化呢?在当下肯定是有些科幻的,但是这个边界和上限确实是比我们想象得要高很多的
基于这个框架和我看到的更多的用户案例,我觉得叫通用Agent是完全没问题的,这一点是我在之前的文章中判断出现问题的地方,我当时的判断更多的是基于官方的use case,在当下技术还不是那么好,完成的任务质量还不是那么高的情况下,可能就是只有这些案例
但是如果从底层逻辑出发,这个产品框架和形态可能就是能走向更加通用场景的,同时也是一种面向技术高速迭代的设计逻辑,相信模型会越来越智能,价格会越来越低,同时随着模型能力的增强,产品的体验会越来越好,而不是被替代掉
之前的那篇文章更多的在思考怎么做,但是比较少分析产品对于用户的核心价值。这次实际使用和看了更多的用户案例之后,对于这个问题有些不一样的思考
我们在AI出来这几年,听到最多的词可能就是降本增效、效率提升等等,这是AI带来的价值,但不是最大的价值,或者最核心的价值,比如降本增效很多之前的工具和Saas也是可以实现类似效果的
AI最大的价值其实更多的在于扩展我们每个人的边界,在Manus这个产品上尤为明显
我们看到更多的use case都是用户可以借助Manus完成了更多之前自己可能完全做不到的事情,想到的事情就有可能被实现,而不是仅仅是想想
它既不像SaaS那样只能做一件事,也不是传统RPA那样死板流程自动化,而是能主动理解目标、不停自我调整,一路推进任务到底
而且更重要的是AI与人的关系,从工具在往协作伙伴的层面持续进化。Agent打破了我们的的体力&信息获取瓶颈,让人往更深层问题进发,AI和人是协作和成长的关系
所以这个时候可能更加理解为什么他们要叫Manus的名字了,行动的价值是巨大的
Manus,源自拉丁语中“手”的意思,
是一款能够将你的想法转化为行动的通用型 AI 助手
基于上面提到产品给用户带来的价值,以及自己在实际使用的感受,总结了几个这种类型Agent需要提供的核心体验
想把一个具体的任务执行好,最开始与用户对齐的过程至关重要,不然就很容易出现AI辛辛苦苦完成了任务,用户发现不是自己想要的,或者理解错了。很多时候交付的结果可能不是不好,而是不是用户想要的
而且观察当下很多人使用AI的习惯,“好像大家都想试试看对面这个AI到底有多聪明,一个个惜字如金的“(开个玩笑)
基于这些背景下,我们就更加需要能准确理解用户的真实意图,哪怕用户的表达比较模糊、口语化,甚至带有一些隐含的上下文
这种“懂你”的体验是使用AI的过程中最爽的体验之一,就是那种你平常工作中有个非常懂你的搭子的感觉,你一个眼神,它就能get到重点
比如你要求它给你一个市场分析报告,它基于你之前问过的相关信息,判断你需要一个PPT去做汇报,然后基于你的目标来进行任务拆分和执行,这种感受带来的用户价值是非常大的
这种体验是你说个大概,它就能领会,甚至能想到我没想到的细节,这样可以建立起强烈的信任感和依赖感
具体到产品设计可能也有一些要求:
这部分其实是很多AI产品的核心,因为大模型技术本身带来的不确定性,我们需要在产品设计上去提高更多的确定性,Manus把虚拟机执行过程放出来其实也是一种传递确定性的方式
现实场景中任务执行的环境和过程还是蛮复杂的,很多时候可能不是所谓的单纯的技术问题,是现实环境问题。
比如登录需要验证码、发现资源没有权限下载、接口不是最新的、代码环境有问题、网络有限制等等,这些问题我们其实就是找个真实的实习生在具体工作中也是有可能碰到的
如果随便碰到一个类似的问题,产品就直接卡住了,其实体验就是不好的,就像现实工作中,我们如果发现有个实习生在类似问题上卡住了,你可能就会觉得这个人有点不太开窍的感觉
所以这些问题怎么有效的解决是产品需要去设计和思考的,怎么能在任务执行的过程中越来越智能,能碰到具体的环境相关的问题及时与用户进行确认,又不要过于打扰用户
比如如果一个账号登录过,是不是后面就不需要持续登录了,就算是不同的任务;
比如一些合适的容错和重试的机制,发现一个方式走不通就换另外一个路径,或者给出一些方案和建议和用户沟通来持续推进;
比如之前可能碰到过的问题,有了对应的解决方案,下次能直接自己解决掉,而不是再次重复一遍
核心就是能随着执行的任务,见过的场景越来越多,变得越来越智能,给用户提供更多的确定性的感受
最后一点是有更多主动性的设计和交互,不是一定是出现了问题才找用户进行确认,创造一个更加舒适的与AI进行协作的环境和感受
基于之前的任务记录和当前的上下文做一些预测性的建议和推送,比如当下的任务是个市场分析报告,然后这个报告里面有提到一个产品是这个用户之前提过的一个主要竞品,那么在完成了当下的任务之后,还可以提醒用户对应的竞品有新的动作,是不是可以深度在分析一下
设置还可以持续关注一些固定的数据或者信息源,当发现有与用户之前的记录和上下文相关的信息后,主动进行推送和分析,判断当前的信息对于用户的价值,提出一些建设性的任务建议
为了更进一步提高用户的安全感和确定性,任务执行的全部过程应该都是可以随时回溯甚至是打一个断点的,而且展示形式上可能不应该是把原始的指令或者代码展示给用户,因为很多时候你展示的这些内容对于用户而言可能也是有一定门槛的
可能需要更加可视化的展示方式,同时还能展示清晰每个节点具体完成的任务是什么,以及能回到具体的时间点去修改一些信息或者补充一些信息重新执行
比如我们可以想象一个场景,如果有个非常复杂的分析报告的任务,假如我们把任务给了一个实习生,那么更加高效的方式是我们先要求实习生给我一个大纲,包括具体的分析目录和准备去哪找信息等等,我们给出一些建议之后在去继续推进
当然作为AI产品我们可能可以要求更多,比如就算任务全部执行完了,我也可以要求回到中间的某个节点的快照,我从这个地方出发提出新的要求,而不是从头开始
具体什么时间节点与用户确认、以什么形式进行确认,也可以有更多的设计和思考,寻找打扰用户和不安全感之间的平衡
个性化的体验其实本质也是在给用户提供确定性,因为个性化对于用户意味着熟悉感,这个AI不是第一天认识我,跟我很有默契的感觉,这也是当前chatGPT里面记忆能力提供的核心价值。(感觉这个功能的价值也是被大家低估了,chatGPT默默上线快两年了)
回到具体的产品上,需要对于用户的习惯、偏好有更多的积累。Manus在这个点上就做得不错,第一天上线就有一个知识模块,虽然当前可能体验不是那么好,但是这个方向一定是值得持续投入的
基于用户持续的使用,去沉淀更多的只与当前用户有关的偏好、习惯和模式
- 比如用户任务所有生成和检索过的内容,都主动沉淀成一个知识库,后面不仅能复用,还能节约成本
- 比如之前的任务中调用过的一些API,或者编写的一些程序,是不是可以形成一个能力库,在后续的任务中被持续的复用,甚至包括用户偏好的搜索习惯,使用工具习惯等等
- 比如用户的各种行为组成的偏好库,交互的节奏、语言习惯、不同的场景下的邮件措辞方式、输出风格、编码的命名习惯、代码的常用库等等
这些偏好和习惯可能帮助我们持续给用户提供独一无二的个性化的体验,同时这些体验也是随着用户的进化而持续迭代的,比如发现用户有个新的习惯,或者有个操作跟之前的习惯不一样,可以主动进行提醒和建议,从单纯被动的工具,变成一个持续进化的协作伙伴
回到具体的产品设计上,可以有更加主动式的设计(AI把这个叫成长式UI,也挺有意思的)
更过主动的预测性的弹窗,比如基于当前用户的行为、具体的页面、任务的需求和其他的上下文,进行一下预测性的信息推送和弹窗(当前Manus就有一些类似设计,感受非常好),比如某个流程要不要设置成默认的,某个任务要不要保存成模版等等
和与人类协作一样,AI可以阶段性的邀请用户一起做个”会议”复盘,比如阶段性沉淀一些偏好和习惯,修正一些有问题的部分。阶段性分析一下数据情况,比如本月累计处理了XXX条数据,传递一种共同完成任务之后的掌控感和成就感
甚至是不是可以考虑更加情绪化的设计,毕竟人是情绪动物,工作中大家也需要更多的情绪价值,比如语气上、碰到具体问题上的一些鼓励,完成任务之后的一些激励等等
这些可能都是以前的纯工具很难去提供的价值
在具体体验的过程中,还是发现了一些之前看use case没有发现的功能细节,有些和上面提到的内容也比较契合,有些也有新的想法
关于任务的二次确认是通过知识模块来实现的(这个设计也很巧妙,相当于二次确认也是用户的偏好之一,而不是单独进行所谓的规则的设定),而且二次确认是在完成了第一个任务之后,开始第二次任务之前,产品主动提出的(这个时机也很棒,相等于把能力嵌入到了具体的流程,而不是硬生生的打断当前的流程去做一个设置)
但是这个系统提示的知识也有一些小问题,就是二次确认的过程有点生硬,就是在硬要求用户去补充更多的信息,而不是那种去追溯原始的目标来补充信息的感觉
就是你的提问是一句简短的要求,比如要一个分析报告,而且确认就是给你提问确认,时间范围、具体的领域和深度要求等等,粗看好像是没问题,但是其实细想更好的问题是不是去思考用户为什么需要这个报告,从目标出发可能可以提高一个更好的答案
就像在职场上类似的逻辑,S级的人才不是只完成任务,而不是去挖掘目标,达成目标,而不是简单的执行命令
当前这可能也有一个人类去适应的过程,大家可能当前的习惯就是我给你一个任务你完成就好了,不要问那么多
关于虚拟机的使用上其实有个比较大的疑问,就是为啥一个用户的不同任务非要开不同的虚拟机呢?更多的信息沉淀到同一个环境不是更容易做上下文信息的沉淀嘛
每次都是新环境不是很浪费嘛,可能之前任务已经积累过的一些配置和信息没办法有效地复用,一些习惯和模板也没办法有效沉淀
想了想应该还是成本问题吧,一直开个虚拟机应该还是蛮贵的,以及任务积分的消耗确实还是蛮大的,看了个会员权益,应该也用不了太多次,成本问题应该是个当下非常重要的问题吧
其他用户分享的use case有个做同款的按钮,想到了最开始抖音病毒式的传播效果
这个思路还是挺好的,用户可能不知道自己能用Manus做什么,可以参考其他人的案例,而且具体功能实现也挺有意思的,好像是把之前用户的上下文+用户当前的诉求一起带入来进行新的任务执行,这样用户还可以提出自己个性化的需求
整个设计还是挺巧妙的,但是也有一些其他的思考,感觉这种方式足够灵活,但是不够精准,比如我可能就是想完全参考别人案例的网站的设计和风格,就只是换一些内容,这种程度可能就是做不到的,因为任务是完全重新执行的
这些引出了另外一个思考就是用户是不是只能分享整个案例,有没有可能分享的是自己做的任务中的某一部分的能力,可能是个模板、可能是个流程呢?不知道这样是不是有可能有构建社区氛围的可能性
这轮AI的带来的可能不仅仅是技术的革命,更是思想的革命。人的想法和思考思考方式是一个更难改变的事情,不管是我们去设计产品的思路,还是用户在使用产品的方式,可能都面临新的变化
虽然从产品形态上来说,Manus是一个非常有想象空间的产品形态,但是实际落地中也还是有非常多的挑战需要解决
这些挑战也不是所谓的模型进化就足够了的,这些挑战来自于我们怎么能回到原点,去思考一个完全智能化的AI产品能给我们带来什么,我们与AI到底应该怎么协作,每一个具体的细节和环节都需要我们重新去思考和设计,怎么给用户带来各方面足够有价值的全新体验,产品设计和细节变得更加的重要
53AI,企业落地大模型首选服务商
产品:场景落地咨询+大模型应用平台+行业解决方案
承诺:免费场景POC验证,效果验证后签署服务协议。零风险落地应用大模型,已交付160+中大型企业
2024-03-30
2024-05-09
2024-07-23
2024-07-07
2025-02-12
2024-07-01
2024-06-24
2024-06-23
2024-10-20
2024-12-29