免费POC, 零成本试错
AI知识库

53AI知识库

学习大模型的前沿技术与行业应用场景


我要投稿

当 Clawdbot 还在控制电脑,AiPy 已经开始控制手机

发布日期:2026-02-10 14:42:02 浏览次数: 1520
作者:AI产品银海

微信搜一搜,关注“AI产品银海”

推荐语

当大家都在讨论AI控制电脑时,AiPy已经悄然实现了对手机的智能操控,将AI执行能力提升到新维度。

核心内容:
1. AiPy通过ADB通道实现手机智能控制的技术原理
2. 实际应用场景展示:从抖音养号到数据分析全流程
3. 开源项目价值与未来智能体调度的发展潜力

杨芳贤
53AI创始人/腾讯云(TVP)最具价值专家


最近大家在聊的 clawdbot 、cowork 这种,本质还是基于大模型去规划和控制电脑里的程序,让 AI 去接管终端、鼠标、键盘、窗口这些操作。


但说到这个,之前有个产品其实在很早的时候,就已经不只是操控电脑了,而是直接把手机也拉进来了。


这个老朋友的名字叫 Aipy,那个想要把智能体当“牛马”使唤的产品。


体验地址:https://www.aipyaipy.com/


它做的事情现在回头看,会觉得挺激进的,它不是只操控本地电脑,而是直接连接到你的手机。


它通过智能的方式,直接调用「安卓手机控制」 的方式,你输入一个需求就能连到手机,然后它会把这句话拆成一套可以执行的脚本,然后在手机上一步步跑完。

这个点其实和前段时间豆包手机里的一些场景已经很像了,而  这个项目也是作为开源项目斩获了3.3k Stars。


项目地址:https://github.com/knownsec/aipyapp


它不仅仅在展示模型的能力,它更想要把手机当成一个可以被调度的执行终端,它的想象力是无限的。


比如你跟它说,你想做一个抖音养号的事儿,它不是给你讲怎么养,而是直接帮你养。


它可以控制手机每隔几秒刷一次抖音,刷的过程中按规则截图,然后把这些截图回传到电脑端,在它的工作目录里面可以看到所有完整的截图。


接下来你还可以基于这些截图,直接让它做整体分析,最后生成一段带有数据图表的分析报告。


这里顺便简单说一句咱们刚刚说操作安卓通信的 ADB 是什么,不然后面很多操作看起来会有点“像魔法”。


ADB 全称叫 Android Debug Bridge,本质上就是安卓手机对外开放的一条“控制通道”。


平时开发者调试 App、测试功能,用的就是它,通过 ADB,咱们可以在电脑上给手机下指令,比如点哪里、装卸应用、截屏、读状态,手机会老老实实照着执行。


所以你可以把 ADB 理解成一件事:这是安卓手机官方面向开发者用户允许的一种“被程序控制”的方式不是黑科技,也不是破解。


只要你授权过,电脑上的程序就可以通过 ADB 去操作手机。


AiPy 做的事情,其实就是站在 ADB 这条通道上,用大模型帮你把“人话”翻译成一连串手机能听懂的操作指令。


所以你看到的只是一句话,手机那边跑的是一整套动作流程。


这种做法思路也是非常的值得借鉴,并且它把这个安卓手机的控制能力作为智能体的方式进行调度,同时通过实时编写 Python 执行脚本的方式下发到手机端上去操作,同样还有非常多原子能力直接可以被智能体调度控制。


所以说,一旦理解了 ADB,这类“AI 接管手机”的事情,其实就没那么玄了,我也算是看到终于有人把它包装成了普通人也能直接用的东西。


这一步里,其实已经把“执行”和“分析”两件事连在了一起。


除了这种偏内容的场景,它在很多日常操作上也非常直接。


比如你让它发一条短信给 10086,它会自动完成文本编辑、点击发送这一整套流程。


再比如你下发一个安装或者卸载应用的指令,它也会全自动执行,一键把应用装好或者卸掉,我这次要做好学生,让它帮我把王者荣耀给删了。


于是它都不带一点犹豫的,直接鼓励我是个好学生真是太有决心了!

你甚至可以做一些脑洞更大的事情,比如让它在手机上隔一段时间就看一眼当前状态是不是正常,比如有些挂机类小游戏,或者需要长时间运行的任务,它可以帮你盯着,一旦发现异常,就继续执行后续动作。


这种模式不显眼,但很适合做批量化、流程化的事情,比如仓库设备状态确认、持续运行任务的监控之类。


底层逻辑其实是把安卓的控制能力封装成一个应用级智能体,然后再由更上层的智能体去调度。


除了手机端,它在电脑上一样也做很多事情。


你只需要下一句命令,它就能去读取你本地的数据,实时生成脚本并执行,比如帮你收集资料、处理本地文件。


比如我这里有一份股票数据,就可以直接让它进行分析,然后进行数据可视化,底层看它调用的是 Python 的数据分析工具,这一点就相对来说踏实很多,比起大模型直接分析这个数据更靠谱。


它通过 Python 的方式去绘制这个数据图表,做过数据分析的同学都知道,这个是最为靠谱的链路了。


最后呢,它也是老老实实的给你交付了这文图文并茂的数据分析报告。

同时呢,AiPy 这个本身还内置了很多不同角色的智能体,用来做更专业的垂直场景拆解,比如生图、生视频、浏览器控制、安卓控制、打印机控制等等。


整体感觉就像是一个“能干活的助理”,你不用关心它内部怎么拆任务。


他只会每次跑完任务之后,亲切的喊你一声“老板!”,正是应了它的这个产品Slogan:超级AI牛马智能体工厂。


此外,你可以在里面自己配置不同厂商的大模型,不管是阿里云、火山引擎,还是硅基流动,都可以按需接进来。


在它的智能体集市里,也有大量现成的 Agent 可以直接用,甚至像 MCP这种能力,都可以一键加进来。


再加上它支持 Mac 和 Windows 多端使用,你会发现它的整体理念其实非常简单,把任务派给它,它自己去干。


就刚刚写到这里的时候,我反而会有一种很强的信息差感。


不论是 Clawdbot 还是 AiPy,现在大家才开始突然蜂拥式的认真讨论“AI 能不能真的接管操作层”。


但在 这里,手机、电脑、脚本、调度这一整套东西,其实已经被完整跑过一遍了,而且能做的事情还是有很多的。


如果你只是想感受一下执行型 AI 和聊天式 AI 的区别,自己亲自随便跑几个完整流程就能明白。



53AI,企业落地大模型首选服务商

产品:场景落地咨询+大模型应用平台+行业解决方案

承诺:免费POC验证,效果达标后再合作。零风险落地应用大模型,已交付160+中大型企业

联系我们

售前咨询
186 6662 7370
预约演示
185 8882 0121

微信扫码

添加专属顾问

回到顶部

加载中...

扫码咨询