微信扫码
添加专属顾问
我要投稿
当大家都在讨论AI控制电脑时,AiPy已经悄然实现了对手机的智能操控,将AI执行能力提升到新维度。 核心内容: 1. AiPy通过ADB通道实现手机智能控制的技术原理 2. 实际应用场景展示:从抖音养号到数据分析全流程 3. 开源项目价值与未来智能体调度的发展潜力
最近大家在聊的 clawdbot 、cowork 这种,本质还是基于大模型去规划和控制电脑里的程序,让 AI 去接管终端、鼠标、键盘、窗口这些操作。
但说到这个,之前有个产品其实在很早的时候,就已经不只是操控电脑了,而是直接把手机也拉进来了。
这个老朋友的名字叫 Aipy,那个想要把智能体当“牛马”使唤的产品。
体验地址:https://www.aipyaipy.com/
它做的事情现在回头看,会觉得挺激进的,它不是只操控本地电脑,而是直接连接到你的手机。
它通过智能的方式,直接调用「安卓手机控制」 的方式,你输入一个需求就能连到手机,然后它会把这句话拆成一套可以执行的脚本,然后在手机上一步步跑完。
这个点其实和前段时间豆包手机里的一些场景已经很像了,而 这个项目也是作为开源项目斩获了3.3k Stars。
项目地址:https://github.com/knownsec/aipyapp
它不仅仅在展示模型的能力,它更想要把手机当成一个可以被调度的执行终端,它的想象力是无限的。
比如你跟它说,你想做一个抖音养号的事儿,它不是给你讲怎么养,而是直接帮你养。
它可以控制手机每隔几秒刷一次抖音,刷的过程中按规则截图,然后把这些截图回传到电脑端,在它的工作目录里面可以看到所有完整的截图。
接下来你还可以基于这些截图,直接让它做整体分析,最后生成一段带有数据图表的分析报告。
这里顺便简单说一句咱们刚刚说操作安卓通信的 ADB 是什么,不然后面很多操作看起来会有点“像魔法”。
ADB 全称叫 Android Debug Bridge,本质上就是安卓手机对外开放的一条“控制通道”。
平时开发者调试 App、测试功能,用的就是它,通过 ADB,咱们可以在电脑上给手机下指令,比如点哪里、装卸应用、截屏、读状态,手机会老老实实照着执行。
所以你可以把 ADB 理解成一件事:这是安卓手机官方面向开发者用户允许的一种“被程序控制”的方式,不是黑科技,也不是破解。
只要你授权过,电脑上的程序就可以通过 ADB 去操作手机。
AiPy 做的事情,其实就是站在 ADB 这条通道上,用大模型帮你把“人话”翻译成一连串手机能听懂的操作指令。
所以你看到的只是一句话,手机那边跑的是一整套动作流程。
这种做法思路也是非常的值得借鉴,并且它把这个安卓手机的控制能力作为智能体的方式进行调度,同时通过实时编写 Python 执行脚本的方式下发到手机端上去操作,同样还有非常多原子能力直接可以被智能体调度控制。
所以说,一旦理解了 ADB,这类“AI 接管手机”的事情,其实就没那么玄了,我也算是看到终于有人把它包装成了普通人也能直接用的东西。
这一步里,其实已经把“执行”和“分析”两件事连在了一起。
除了这种偏内容的场景,它在很多日常操作上也非常直接。
比如你让它发一条短信给 10086,它会自动完成文本编辑、点击发送这一整套流程。
再比如你下发一个安装或者卸载应用的指令,它也会全自动执行,一键把应用装好或者卸掉,我这次要做好学生,让它帮我把王者荣耀给删了。
于是它都不带一点犹豫的,直接鼓励我是个好学生真是太有决心了!
你甚至可以做一些脑洞更大的事情,比如让它在手机上隔一段时间就看一眼当前状态是不是正常,比如有些挂机类小游戏,或者需要长时间运行的任务,它可以帮你盯着,一旦发现异常,就继续执行后续动作。
这种模式不显眼,但很适合做批量化、流程化的事情,比如仓库设备状态确认、持续运行任务的监控之类。
底层逻辑其实是把安卓的控制能力封装成一个应用级智能体,然后再由更上层的智能体去调度。
除了手机端,它在电脑上一样也做很多事情。
你只需要下一句命令,它就能去读取你本地的数据,实时生成脚本并执行,比如帮你收集资料、处理本地文件。
比如我这里有一份股票数据,就可以直接让它进行分析,然后进行数据可视化,底层看它调用的是 Python 的数据分析工具,这一点就相对来说踏实很多,比起大模型直接分析这个数据更靠谱。
它通过 Python 的方式去绘制这个数据图表,做过数据分析的同学都知道,这个是最为靠谱的链路了。
最后呢,它也是老老实实的给你交付了这文图文并茂的数据分析报告。
同时呢,AiPy 这个本身还内置了很多不同角色的智能体,用来做更专业的垂直场景拆解,比如生图、生视频、浏览器控制、安卓控制、打印机控制等等。
整体感觉就像是一个“能干活的助理”,你不用关心它内部怎么拆任务。
他只会每次跑完任务之后,亲切的喊你一声“老板!”,正是应了它的这个产品Slogan:超级AI牛马智能体工厂。
此外,你可以在里面自己配置不同厂商的大模型,不管是阿里云、火山引擎,还是硅基流动,都可以按需接进来。
在它的智能体集市里,也有大量现成的 Agent 可以直接用,甚至像 MCP这种能力,都可以一键加进来。
再加上它支持 Mac 和 Windows 多端使用,你会发现它的整体理念其实非常简单,把任务派给它,它自己去干。
就刚刚写到这里的时候,我反而会有一种很强的信息差感。
不论是 Clawdbot 还是 AiPy,现在大家才开始突然蜂拥式的认真讨论“AI 能不能真的接管操作层”。
但在 这里,手机、电脑、脚本、调度这一整套东西,其实已经被完整跑过一遍了,而且能做的事情还是有很多的。
如果你只是想感受一下执行型 AI 和聊天式 AI 的区别,自己亲自随便跑几个完整流程就能明白。
53AI,企业落地大模型首选服务商
产品:场景落地咨询+大模型应用平台+行业解决方案
承诺:免费POC验证,效果达标后再合作。零风险落地应用大模型,已交付160+中大型企业
2026-02-10
普惠新篇章:香橙派全志系列开发板全面拥抱OpenClaw时代
2026-02-10
OpenClaw 之后,清华系团队给端侧 AI 找了一条「端云协同」的新路
2026-02-10
YC 专访 OpenClaw 创始人:80% 的 App 将会消失,我们还剩下什么?
2026-02-10
香橙派昇腾系列开发板解锁专业级智能体,OpenClaw拥抱高算力未来
2026-02-03
OpenAI成立百人团队训练机械臂做家务,今年是否能迎来机器人管家
2026-01-31
AI硬件的宿命:要么“在场”,要么“进抽屉”
2026-01-31
我们测了十几款AI硬件,发现它们死于同一个问题
2026-01-29
LiteRT | 释放极致潜能,构建下一代高性能端侧 AI
2025-12-05
2025-12-09
2025-12-01
2025-12-08
2025-11-17
2026-01-29
2025-12-15
2025-12-01
2025-12-03
2025-11-25
2026-02-10
2026-01-29
2026-01-22
2026-01-06
2026-01-04
2026-01-02
2025-11-08
2025-10-27