2026年7月2日 周四晚上19:30,报名腾讯会议了解“如何构建自进化的动态知识库(Brain)”(限30人)
免费POC, 零成本试错
FDE知识库

FDE知识库

学习大模型的前沿技术与行业落地应用


收藏

腾讯造了个“贾维斯”:替我签到改配置,还会打盹上厕所,一手实测来了

发布日期:2026-05-16 08:57:25 浏览次数: 2382
作者:智东西

微信搜一搜,关注“智东西”

推荐语

腾讯打造操作系统层AI助手Marvis,24小时在线帮你处理文件、监控动态,还能打盹摸鱼,让AI真正成为你的数字同事。
核心内容:
1. Marvis的核心功能:跨端操作、文件管理、任务自动化
2. 特色设计:虚拟办公室与Agent协作机制
3. 技术优势:端侧优化与操作系统层深度控制

杨芳贤
53AI创始人/腾讯云(TVP)最具价值专家

智东西5月15日报道,近日,腾讯开始内测一款名为Marvis(马维斯)的操作系统层个人AI助手。这一AI助手通过多个Agent的协作完成App操作、EXE操作、电脑操作、文件管理、文档生成以及各种复杂任务,24小时持续在线,并支持跨端操作。
Marvis目前仅支持Windows PC和安卓手机,iOS/macOS即将上线。
具体到日常使用场景,Marvis能干不少活。工作场景中,它能做文件格式转换、合同信息审查、运营数据分析,甚至帮忙整理参考文献。这些功能超越了单纯的文字、代码生成,能真正去操作系统、文件和应用等更为底层的元素。
在生活娱乐场景中,它能帮你监控游戏限时福利和明星动态,自动完成微博签到、整理高清物料,也可以定时执行每天早上的新闻汇总。
Marvis这一名字致敬了知名智能助手“Jarvis”,取自“马(Ma)”与“Jarvis”的结合。比较有趣的是,它把每个Agent的形象设计成一只长着牛角的黑色小马,简称“小牛马”,“小牛马”还继承了腾讯企鹅标志性的围脖
你可以在虚拟办公室里随时查看每只Agent在干什么,被安排任务的Agent会坐在工位上认真搬砖,其他闲着的Agent可能会打盹、闲逛、健身、喝咖啡或上厕所。
当你指定任务后,会有一只Agent主管出来主持大局,分配任务给相应的Agent,Agent在完成工作后会向主管汇报。
目前Marvis里的专家Agent具备App操作、电脑系统运维、网页交互、数字资产管理和搜索任务等能力。
Marvis目前提供了两种运行模式:云端效率模式采用混元和DeepSeek V4等最新模型,本地隐私模式则采用Qwen端侧模型,做到一句话都不出电脑。
这一产品还支持本地知识库的功能,可以自动识别本地文档、图片并进行索引。当用户需要搜索特定内容时,Marvis可以基于标题匹配或基于内容匹配。

与同样能操控电脑的其他“龙虾类”产品相比,Marvis有什么优势?

智东西获知,Marvis背后是腾讯应用宝团队,继承了十几年与英特尔、微软等软硬件厂商的合作关系和跨端引擎技术。

因此,Marvis不仅能操作电脑EXE软件,还能通过应用宝,直接在电脑上操控手机App(同花顺、开盘啦、飞常准、汽车之家、唯品会等App已授权)

团队通过对端侧模型做芯片级优化,实现了跑端侧模型速度提升20%,并能通过提示词直接对电脑文件进行查询、变更等操作。而当前大多数AI应用都做不到这种深入操作系统层的能力。

智东西第一时间拿到Marvis的内测资格。根据我们的实际体验,Marvis展现了“AI打工人”的雏形,它能实实在在地帮你干活,完成任务的质量不错,但在速度、token消耗量、灵活性等方面仍有提升空间。
🎁福利:智东西准备了一些邀请码送给读者朋友们,获取方式见评论区。
指路:marvis.qq.com

01.
找文件、调设置
Marvis全动手试了一遍


电脑操作是Marvis的一大长板。Marvis拥有系统级的能力,可直接完成对电脑的全流程操作。我们的首批案例就围绕这类任务展开。
进入主页后,用户可以直接与Marvis对话并指派任务,也可通过自动任务页面让Marvis定时执行既定任务。
案例1:图像搜索、文件定位都能胜任,就是有点烧token
对许多用户来说,在本地设备上寻找指定的文件或图像,是件费时费力的事情。我试着让Marvis帮我在本地的下载文件夹中,找到一张包含纳斯达克元素的图片。
拿到这一任务后,Marvis的团队负责人Agent把任务分配给了文件处理Agent,后者先是尝试了文件名搜索,未获得命中。在这一过程中,它判断我的图片命名大多无意义,决定换个思路,用图像分析来找到相关图像。
切换思路后,Marvis终于步入了正轨,它成功地找到了包含纳斯达克相关元素的图片。然而,调用图像分析工具,Marvis的token消耗量呈现指数级的增长。在搜索了一百多张图片后,总消耗量来到了200万token。
Marvis可以完成跨端的文件查找和传递。我在手机上向Marvis发送了一条命令,搜索与字节跳动估值有关的文件并发送到我的手机上。
它很快找到了文件,并发送到我的手机上。可能是因为这次文件名本身就包含了需要查找的关键词,任务的token消耗量明显降低了。
案例2:精准抓取电脑配置,还给我提了优化建议
Marvis可以直接在Windows系统层进行一些操作。当我要求它帮我把电脑的主题调为绿色时,Marvis的电脑操作Agent接手了工作,并直接找到了系统主题色的设置入口。这一操作并未通过模拟点击实现,应该是深入了系统底层。
不过,它没有100%完成这一任务,停在了找到入口这一步,后续的具体设置需要我手动操作。
Marvis可以精准地获取各种系统信息。当我向它咨询我的设备是否支持《黑神话·悟空》这样的大型游戏时,它快速整理出了我的系统配置,看样子是直接在设置中找到了相关内容。
紧接着,我让Marvis分析了我这套配置中的短板,并提出升级建议。它判断我的显卡配置充裕,但是CPU、内存和硬盘都稍显落后。Marvis建议我对内存进行升级,并说这是性能提升最直接、成本最低的方式。
不过,它似乎不了解当内存涨价的情况,告诉我32GB的DDR4 3200MHz内存只要四五百块。实际情况是,同类内存的价格至少也得1000元出头。
在我们的实际体验中,Marvis在遇到批量删除文件、核心配置修改时一定会询问用户,用户点击确认后才会执行。

02.
写代码、出报告
多Agent协作有亮点


多Agent的协作,理论上可以完成更复杂的任务,或是提高任务执行的质量。我们拿几个复杂任务试了试Marvis的能力边界。
案例1:开发本地知识库,全程无需碰代码
我们的首个复杂任务要求Marvis设计一个本地知识管理系统,支持自定义大模型接入,实现简单的RAG。
在这种更复杂的任务中,Marvis反而没有调用多Agent,而是由主Agent完成所有的开发工作。Marvis陆续创建了目录结构,并且并行写入了配置文件和核心模块,之后打造了Web界面。Marvis默认使用了Ollama本地跑模型,我要求它切换为接入外部API的模式。
Marvis提供的API设置界面较为人性化,它向我发送了选项卡,只要逐步选择并填写信息就行。
最终,Marvis按照我的要求打造出了这一知识管理系统,支持导入文件、导入目录、导入文本等选项,可提供参考来源。我们试着上传了几份文件并询问相关信息,该系统输出的内容准确,也没有编造不在知识库内的信息。
案例2:盘点硅谷裁员潮,直接输出PDF文件
下一个实测任务要求Marvis梳理一下今年硅谷大厂的裁员情况,做成一个PDF网页,包含裁员数据和分析,每条数据背后附上单独的消息来源。
在这一任务中,Marvis使用了多Agent协作的模式,文件Agent被唤起,并主动调用了文档写作Skill。这一Skill要求模型先做复杂度判断,然后加载写作模板、写作规范,再开始正式的执行。
Marvis判断这属于一个复杂文档,预计产出超过3500字。它进行了多轮的网页搜索,收集到足够数据后开始逐页撰写PDF内容,最终输出了一份完整的调研报告。
执行过程中,Marvis的多Agent协作让任务划分更加合理,两个Agent的并行工作一定程度上提高了效率。不过,这一任务中Agent出现了自主切换到英文的问题,Skill的内容和背后模型的特性可能导致了这一现象。
Marvis生成的文档可以直接在侧边栏中进行预览,从结果来看,这一文档的内容明显要比AI单次生成的内容来得详实,文中的数据基本准确。
排版方面,这一文档的风格比较朴素,通过表格、加粗、章节划分等方式,让内容的可读性更强。这种输出方式应该与Marvis内置的Skill有关。

03.
靠应用宝操作安卓应用
效率仍有提升空间


Marvis可以通过腾讯应用宝在Windows PC上完成对安卓App的操作,并且相关操作不会干扰PC的正常使用。安装应用宝后,我们对这部分功能进行了体验。
案例1:自动到微博打卡签到,任务耗时3分多钟
Marvis官方在首页展示了微博超话签到这一任务。我们也实测了一下,要求Marvis打开微博去陈奕迅超话签到。
App操作Agent是这一任务的主要执行者。我们提前在应用宝中下好了微博并登录,以免Marvis在登录这一步卡住。
Marvis的执行速度不太理想。此前我们已经跑过类似任务,但它还是较为机械地按照规范来,检查微博安装包,试图搜索微博操作Skill,未果后直接开始任务执行。
开始操作后,Marvis只能截图一步,操作一步,每张截图都要分析个几秒钟,整个任务的执行时长被拉到3分多钟。下图是它的完整执行过程,画面经过20倍速的处理。

▲动图经过20倍速处理

借助Marvis的定时任务功能,用户可以把上述App操作设置为每天自动执行的任务。不过,前提是电脑必须保持24小时开机。
案例2:拒绝小红书、微信操作请求
除了微博之外,我们也尝试了Marvis操作其他App的能力。当我们要求它操作微信并发送消息时,Marvis拒绝了这一请求,称由于系统限制无法在微信内执行点击和输入操作。我们尝试了小红书,也同样无法操作。
这可能是因为微信这类App的聊天和支付界面,本身可能就有防模拟点击、防注入输入的特殊安全机制,如果AI助手能随意替用户在微信上发消息、转钱,一旦被恶意利用,造成的风险和平台责任是平台无法承受的。因此,Marvis从源头上拒绝了任何涉及资金划转的自动交易等操作。
我们也尝试询问Marvis它到底可以直接操作哪些应用,不过Marvis一直答非所问。

04.
结语:AI打工人雏形已现
但离“放手”还有距离


对于愿意尝鲜的极客用户来说,Marvis已经能带来实打实的效率提升。然而,现在普通用户仍无法完全放手让Marvis执行一个任务,复杂的软件生态、文件系统等影响因素,都有可能让Marvis的任务执行中断或偏离预期。
不过,Marvis的设计思路确实代表了一种明确的趋势。目前,国内已有不少AI厂商在多Agent产品上展开探索,跨端协同也逐渐成为行业共识。尽管体验还需要进一步打磨,但腾讯至少已经迈出了第一步。

53AI,企业落地大模型首选服务商

产品:场景落地咨询+大模型应用平台+行业解决方案

承诺:免费POC验证,效果达标后再合作。零风险落地应用大模型,已交付160+中大型企业

联系我们

售前咨询
186 6662 7370
预约演示
185 8882 0121

微信扫码

添加专属顾问

回到顶部

加载中...

扫码咨询

扫码登录
登录即表示您同意《53AI网站服务协议》
服务协议

欢迎您使用【53AI 官方网站】(以下简称“本网站”或“我们”)。本《会员服务协议》(以下简称“本协议”)是您(以下简称“会员”或“用户”)与【深圳市博思协创网络科技有限公司】之间关于注册、登录及使用本网站会员服务所订立的法律协议。

在您注册或登录前,请务必审慎阅读、充分理解各条款内容,特别是免除或限制责任的条款、知识产权条款、争议解决条款等。此类条款将以加粗形式提示您注意。 当您通过微信公众号授权、手机验证码验证或其他方式成功登录本网站时,即视为您已完全理解并同意接受本协议的全部内容。

一、 定义

本网站:指由【深圳市博思协创网络科技有限公司】运营的,域名为【53ai.com】的网站及相关移动端页面。

会员服务:指本网站向注册会员提供的知识库文章查阅、内容检索及其他相关增值服务。

知识库内容:指本网站发布的包括但不限于文字、图表、数据、研究报告、行业分析等数字化内容资源。

二、 账号注册与登录

登录方式:本网站支持以下登录方式,您可根据实际情况选择:

微信公众号授权登录:您同意将您的微信OpenID信息授权给本网站,用于创建或关联会员账号。

手机验证码登录:您需提供真实有效的手机号码,并通过短信验证码完成身份验证与登录/注册。

账号安全:您的账号仅限您本人使用,禁止赠与、借用、租用、转让或售卖。因您保管不善导致的账号被盗、密码泄露等损失,由您自行承担。

实名认证:根据相关法律法规要求,我们可能要求您在特定功能下完成实名认证。如您拒绝提供,可能无法使用部分或全部服务。

未成年人保护:若您未满18周岁,请在法定监护人的陪同下阅读本协议,并在征得监护人同意后使用本服务。

三、 服务内容与规范

知识库查阅权限:会员登录后,有权按照其会员等级对应的权限范围,在线浏览、检索本网站知识库中的相关文章及内容。

服务变更:我们有权根据业务发展需要,调整、变更或终止部分服务内容,并将以网站公告、公众号消息等方式提前通知。

禁止行为:您在使用服务时不得实施以下行为:

利用技术手段批量爬取、下载、转存知识库内容;

将知识库内容用于商业目的或未经授权地向第三方传播;

干扰本网站正常运行或侵犯其他用户合法权益;

发布违法违规信息或从事违反公序良俗的活动。

四、 知识产权声明

权利归属:本网站知识库中的排版设计、软件代码等内容的知识产权均归【公司全称】或原权利人所有,受《中华人民共和国著作权法》等法律保护。

有限许可:本网站授予会员一项非独占、不可转让、不可转授权的普通许可,仅限于个人学习、研究之目的在线查阅知识库内容。

侵权追责:未经书面许可,任何单位或个人不得以任何形式复制、转载、摘编、镜像、汇编或以其他方式使用上述内容。一经发现,我们保留追究其法律责任的权利。

五、 个人信息保护

我们重视对您个人信息的保护。关于我们如何收集、使用、存储和保护您的个人信息,请单独阅读 《隐私政策》。

您通过微信公众号授权或手机号验证所提供的信息,我们将严格按照《个人信息保护法》的规定处理,仅用于身份识别、服务提供及安全验证等必要用途。

您可以随时通过网站设置或联系客服行使查阅、更正、删除个人信息及撤回授权同意的权利。

六、 免责声明

内容准确性:知识库内容仅供参考,不构成专业建议。我们不对其完整性、准确性、时效性作任何明示或暗示的保证,您应自行判断并承担使用风险。

不可抗力:因自然灾害、政策法规变化、网络故障、第三方平台接口异常(如微信接口维护、运营商短信通道故障)等不可抗力导致的服务中断或延迟,我们不承担违约责任。

第三方链接:本网站可能包含指向第三方网站的链接,该等网站的内容和服务不受我们控制,请您自行甄别风险。

七、 违约责任

如您违反本协议约定,我们有权视情节采取警告、限制功能、暂停服务、注销账号等措施,并保留要求赔偿损失的权利。

如因您的违约行为导致我们遭受行政处罚、第三方索赔或商誉损失,您应承担全部赔偿责任(包括但不限于罚款、赔偿金、律师费、公证费等)。

八、 法律适用与争议解决

本协议的订立、执行和解释均适用中华人民共和国大陆地区法律。

因本协议产生的或与本协议有关的任何争议,双方应友好协商解决;协商不成的,任何一方均可向【公司所在地】有管辖权的人民法院提起诉讼。

九、 其他

本协议构成双方就本服务达成的完整协议,取代此前任何口头或书面约定。

本协议任一条款被认定为无效或不可执行的,不影响其他条款的效力。

我们对本协议享有最终解释权,并在法律允许的范围内保留随时修改的权利。修改后的协议一经公布即生效,继续使用服务即视为同意修订内容。


已查阅