免费POC,零成本试错

AI知识库

53AI知识库

学习大模型的前沿技术与行业应用场景


iPhone 17 不支持 AI Agent,但邪修的智谱不管

发布日期:2025-08-21 14:43:02 浏览次数: 1523
作者:橘子汽水铺

微信搜一搜,关注“橘子汽水铺”

推荐语

苹果用户的小痛点藏着大商机,邪修方案让iPhone也能玩转AI Agent!

核心内容:
1. 苹果在AI功能上的滞后与用户痛点带来的创业机会
2. 智谱AutoGLM的云安卓方案实现iPhone操控多款App
3. 实际体验展示AI Agent在生活场景中的智能应用

杨芳贤
53AI创始人/腾讯云(TVP)最具价值专家

拉胯的苹果

苹果是家很神奇的公司。

有很多事情别人都能做,就他做不到。

但苹果用户的小痛点里,藏着未被发现的宝藏。

就说电话录音这个功能。

用户需求说了好几年,苹果就是不做。

结果诞生了 Plaud,靠邪修的震动录音法实现了 iPhone 电话录音。

一年出货100万台,年化收入超过1亿美金。

而 AI 相关的功能,谷歌、小米、Oppo、华为都已经在做深度集成了。

苹果却做的非常拉胯。


邪修的智谱

Siri 的智商停留在14年前,想让苹果做一个能控制手机系统和软件的 Agent?

目测五年内搞不出来,想都别想了。

但上周智谱的朋友跟说,他们让 AutoGLM 邪修了一套方案。

竟然给每个 iPhone 配了一台云安卓。。。

就这样, 安卓上能操控各家 App 的通用智能体,iPhone 用户也可以玩了。

听到这个方案的我大为震撼,我买安卓备用机的钱就这么都省了?

周日的时候抱着强烈的好奇心,就去现场看了一下 iPhone 上的邪修 AutoGLM。


AutoGLM 能做什么?

Agent 相比 Chatbot,最大的特点就是真的像有手,真的能操作系统。

Manus 能操作云电脑,把 Agent 的抽象概念变得具象化。

AutoGLM 能操作云手机,让我们看到了手机 Agent 的具体形态。

只要你一句话安排任务,AutoGLM 就能在后台开启多个云手机和云电脑,同步协作,共同完成目标。

它支持了抖音、小红书、美团、京东等 40+ 高频应用,平时点外卖、订机票、查房源、预约健康服务,它都能搞定。

办公场景中,做调研、写PPT、做短视频,也都能搞定。

虽然介绍写的很全面了,但实际效果如何呢?

我去体验了一番。

体验1: 帮我去眉州东坡点个油条豆腐脑

今天起的太早了,有点饿,就让它帮我点个外卖

任务开始的时候,它先会启动一台虚拟云端手机。

启动手机后,它打开了美团,这时候需要我来接管,输入我的手机号和验证码。

登录成功之后,它就开始自己搜索油条豆腐脑。

搜到之后,它添加了一根油条,然后添加了第二根油条,然后添加了第三根油条。。。

Image

它也算是完成了任务。

只是对我的食量存在一些误解,这也许就是未来长期记忆可以优化的地方吧。😂

不过要注意的是,在这样的任务里,最后的确认订单和支付是敏感信息,还是要我自己来的,这不是做不到,而是出于安全的考虑。


体验2:去京东订购我常买的猫砂

家里的猫砂快用完了,我就让它去采购一下。

Image

它竟然真的找到了我以前买的猫砂,然后给我添加到了购物车里,还是很方便的。

最后一步,确认订单和支付环节还是得我自己来完成。


体验3:自动发播客

AutoGLM 除了能调用云手机,还可以调用云电脑。

这时候的能力要比手机要强一些,毕竟手机只支持操作APP,而电脑支持浏览器里的开放性任务。

任务:去 ListenHub.AI ,输入话题 :AutoGLM,生成一期播客,下载并上传到小宇宙创作者中心。

这个任务就有点难度了。

难点在:

  1. 1. ListenHub 的下载按钮隐藏很深,很多用户都找不到
  2. 2. 小宇宙的上传网页也隐藏很深,很多用户都找不到
  3. 3. 文件的下载和上传,都是需要系统级别的操作

它首先规划了一下流程,虽然基本正确,但它不知道 ListenHub 自带材料收集,所以第一步多此一举了。

Image

然后它打开了 ListenHub 并且成功生成了播客

Image

这时候就来到了难点1,它真的找不到下载按钮,哪怕我告诉它在3个点菜单里。

然后它就开始找小宇宙的后台,但它找错了,去了小宇宙的官网。

小宇宙官网是这样的,直接给它搞懵了,它就以为完成了任务,结束了。

Image

三个任务跑下来,总体感觉这个方式很新奇,但产品仍然处于早期实验阶段,前路漫漫,未来可期。


AutoGLM 的突破点

首次实现了手机和Web的双端协作,Agent 不仅可以操作云电脑,还可以操作云手机。让工作任务和生活任务可以兼得。


AutoGLM 的差异性

AutoGLM 和其他手机 Agent 的区别在于

它不会影响你当前的任何其他的工作。

它会开启一个云手机在上面跑任务。

而且可以几个 Agent 也可以同时跑。

这就像云游戏,再也不挑设备了。


AI 硬件终端合作

既然都云手机了,其实就不局限于设备了

连智能眼镜也能跑。

用你的 Rokid 点外卖吧。

真正赋能 AI 硬件云端智能能力。

目前智谱已经向开发者开放能力,硬件厂商可以蹲一下。


大幅下降的成本

Agent 一次任务需要 0.2 美元。

而谷歌搜索一次调用需要 0.02 美元/次。

Agent 终于和搜索只差一个数量级了。

预测明年大家就 Agent 自由了。


当下,手机 Agent 存在的实际问题

虽然手机 Agent 这个技术方向非常好,但仍然处于非常早期的实验阶段。

因此当前阶段仍有如下问题:

  1. 1. 任务成功率太低了,十次成功一次,要真正的C端可用,至少得到50%成功率
  2. 2. 意图理解和界面理解的水平都不够,在猫砂任务里,第一次完成了,第二次我想录个屏,它就没去订单里找,而是直接在主页搜了猫砂。
  3. 3. 任务经常莫名奇妙就终止了,模型认为自己完成了任务,所以没有报错信息,作为用户有点懵。
  4. 4. Agent 只会往前操作,不会返回上一步,不会重启app。在开启新话题的时候,手机还停留在上一个app内,Agent 这时候就不会了。
  5. 5. Agent 在操作电脑和手机的时候,遇到价格弹窗、广告弹窗,就直接干懵了,不像人能精准地找到x按钮,当然这部分人类产品经理也有一定的责任
  6. 6. 手机版的Agent只会用几十个固定的app,目前还不会用浏览器做开放任务,比如让它逛nga查游戏资料,它会说自己还没学会
  7. 7. 在购买类任务里,添加购物车要确认、订单支付也要自己来,无法实现完全自动化,比如每三个月采购一次猫砂这种任务,如果还需要确认就没失去了自动化的意义,目前还没有能兼顾安全性和便捷性的方案
  8. 8. Agent 在使用手机的过程中需要用户接管输入登录等信息,可能存在一定隐私泄露风险,这部分需要根据自己的情况来权衡方便和隐私
  9. 9. Agent 操作的账号有会被一些网站比如小红书识别为机器人,这可能会引发封号风险,所以 Agent 虽然可以自动化,但任务安排上也要有活人感,不要安排一些连续点赞之类的任务
  10. 10. 云手机和云电脑的资源不足,一大早7点就没资源了,这比上班地铁还拥挤,也能看出目前是实验功能
  11. 问题真的不少,要完美解决这些问题,我预测至少还需要一年,但是如果我们视而不见只是一味吹捧,那可能要花更久的时间。


展望未来

看到这么多的问题之后,我们依然要展望未来。

以前我们总觉得,手机的尽头,就是换一块更好的屏幕,卷一颗更快的芯片。

大家都在这块小小的玻璃上卷生卷死。

但智谱的邪修 AutoGLM,把空间直接升维到了云端。

未来的重点根本不在你手里这块玻璃上。你只需要动动嘴,后台的 AI 就开始自己规划干活交付结果。

这一下,什么 App 好不好用、系统是 iOS 还是安卓,突然就没那么重要了。

因为你根本不用再一个个去戳那些图标了。

不管是手机、智能硬件还是未来的机器人,都变成了一个“遥控器”,一个发号施令的入口。

真正的活儿,全在云端的无数个 Agent 手里干完了。

手机是一个非常完美的设备。

它几乎完美地平衡了性能、便携性、续航。

因此,很难有硬件能够取代它。

但是有了云手机 Agent,这一切却可能发生变化。

一副耳机,一副眼镜,一个毛绒玩具。

都是通向无限可能的入口。

53AI,企业落地大模型首选服务商

产品:场景落地咨询+大模型应用平台+行业解决方案

承诺:免费POC验证,效果达标后再合作。零风险落地应用大模型,已交付160+中大型企业

联系我们

售前咨询
186 6662 7370
预约演示
185 8882 0121

微信扫码

添加专属顾问

回到顶部

加载中...

扫码咨询