免费POC, 零成本试错
AI知识库

53AI知识库

学习大模型的前沿技术与行业应用场景


我要投稿

豆包手机之后,AI 手机还需要什么?

发布日期:2026-01-06 05:51:20 浏览次数: 1535
作者:Rog3r

微信搜一搜,关注“Rog3r”

推荐语

豆包手机展现了AI手机的初步能力,但真正的个性化助理还有多远?

核心内容:
1. AI手机当前的技术水平与局限性
2. 记忆管理在个性化服务中的关键作用
3. 手机厂商面临的挑战与未来发展方向

杨芳贤
53AI创始人/腾讯云(TVP)最具价值专家

AI 手机应该如何定义

最近我一直在高频使用 Claude Code《Claude Code 从零到一实践与经验分享》,同时也在研究 Coding Agent 的技术架构《从零构建 Agent 这么简单?Bash is All You Need》。在整个技术体系中,上下文工程是绕不开的核心命题——也就是如何管理记忆:哪些是每次运行都必须加载的永久记忆,哪些是执行特定任务时才需要的临时记忆。

这个问题的答案很现实:对于生产力工具而言,记忆只是手段,最终目的是提升任务成功的概率。我让 AI 干活,不需要顾及它的感受,只要它能把事情做好,它需要什么记忆,我就给什么。

但这类记忆需要我们主动提供,某种程度上缺少了一些温度。随着与 ChatGPT 的对话越来越多,它会逐渐记住我们的聊天内容、偏好习惯、背景信息,进而给出更贴合我们需求的回答。这种记忆是被动沉淀下来的,是为了在未来提供更个性化的服务。正因为有了这些记忆,AI 才能为不同的人提供专属的答案或推荐。

豆包手机的出现让「AI 手机」火了一把,大家都在惊叹它能够自动完成各种操作任务。这一阶段的技术能力,其实就是当前 Claude Code 所展示的水平——随着模型能力增强,任务执行的准确率会进一步提升。这确实是生产力的跃升,但距离真正的「个性化助理」还有相当的距离。

手机作为现代人每天接收和处理信息的核心工具,是天然的记忆入口。苹果国行 AI 一直在画饼,安卓阵营则纷纷推出了自己的记忆助手,但是 AI 手机好像一直没来。

新的交互革命

这波由 ChatGPT 引领的 AI 热潮已经持续了好几年。从一开始,就有人在讨论它是否会带来新的交互革命——AI 颠覆手机行业的「iPhone时刻

很多创业团队也做过 AI 硬件的尝试,但大多数都没啥意思,本质上只是把大模型套了一个硬件的外壳。在「AI 能为手机带来什么」这个问题上手机厂商们在之前的共识似乎是:给手机助手套一个大模型的壳,但这也没带来什么实质性的体验跃迁

手机厂商的「慢」,是可以理解的。当前厂商的存量市场至少都是上亿用户,任何新功能的推出,面向的用户和场景都极其复杂。对于 AI 创业公司来说,还有大量细分赛道可以深耕。但如果要为某一个细分场景去做一款专门的 AI 手机,逻辑上是走不通的。

所以手机厂商选择的功能,必然是更加偏向公共基础能力、面向大多数用户的。记忆在过去一年已经成为了各家的共识——当前手机作为每天陪着用户的设备,上面留存着用户大量的长期数据。那么这些数据在 AI 时代能否为用户创造更多价值?

这涉及到数据的完整链路:从获取到存储,再到最终的应用。也就是从感知到记忆,然后再到个性化。这几者之间的关系是什么?

个性化应该是主动的。基于对本地数据的分析,AI 能够提供个性化的服务。以记忆为中间节点,扩展感知数据的边界,然后动态地给用户推荐和个性化服务,这才是新的价值增量。

一个拥有持续上下文的 AI,最终会发展成一个个性化的 OS。最终的 Agent,也应该是一个个性化的 Agent。

手机上的记忆

手机上能够做到的记忆,可以分为两大类。第一类是单纯的信息,比如用户的个人信息,不带任何个人情感的客观数据。第二类是关于个人偏好、关系个人情感的数据,比如个人的收藏偏好,这类与情感相关、能够构建个人画像的数据。

在没有 AI 的时代,人们每天通过互联网接触到的信息已经足够多了。但收藏其实是一个痛点——用户接收的信息太多,却无法有效处理。收藏这个行为本身,并没有为用户创造任何实质价值,文章只是静静地存在那里。

记忆的价值漏斗

记忆的价值不是一个平面,而是一个层层递进的价值漏斗。

第一层是摘要价值。从原始的收藏内容,记忆提炼成摘要,实现信息的聚集,让用户能够更快速地感知核心内容。

第二层是组织价值。当足够多用户关心和喜欢的内容聚集在一起,这些信息能够进一步归纳,构建知识图谱,反映用户的行为偏好。

第三层是认知增强价值。这些记忆内容能够成为用户的「第二大脑」,在必要的时候提供足够的认知支撑。

要实现这些功能,第一步就是信息的摘要。手机可以记录内部信息,也需要记录外部用户输入的信息。所以实际记录的场景会非常广泛,从各大社交 APP 到用户的语音、文字输入,都是可能进行记忆的入口。

人类大脑天然的容量受限,「第二大脑」能够帮助用户记忆更多内容。但仅有记忆还不够,基于当前 AI 的能力,应该在记忆的基础上产生足够的认知价值。而认知,就需要有足够的上下文支撑。

产品化的挑战

然而,摘要这个功能实际对应的场景也很复杂。比如对于公众号文章,摘要需要的是内容总结;但对于通话录音,摘要更多是需要记录日程或重要的事件安排。虽然都叫「摘要」,但背后要理解不同场景下的用户需求,并且把它翻译成大模型能听懂的语言。

这不仅是技术实现的问题,更是产品和设计的问题。不仅需要做摘要模块,还需要做意图分流,去理解用户的意图。整个过程需要技术、产品、设计多方协同。

记忆只是结果,但不是最终的目的。如果要让手机更加个性化,需要先回答几个问题:在什么场景下,为什么样的用户,创造什么样的价值?

倒推回记忆的问题:究竟要记忆哪些数据?哪些数据在未来能够为用户提供实际价值?再回到记忆的场景:做什么样的功能,用户才愿意把有效的上下文交给我们?

就比如公众号文章摘要的场景,用户可能只是想看一下摘要,之后就结束了,并不需要产生与用户实际记忆的深度关联。

单纯的记忆,不能够让用户真正感知到价值。所以需要创造场景让用户感知到记忆的存在。比如刚记下的重要信息,需要能够通过问答快速提取出来。

记忆也应该是可遗忘、可更新的。这部分的技术实现还有一定的挑战。用户该遗忘什么、不该遗忘什么,这个问题也需要先定义清楚。

从推荐到生成

这和上一代推荐算法、推荐引擎最核心的不同在于:上一代的「主动推」,是推荐用户可能感兴趣的原子信息,精准度有限,更多是基于大数据统计的算法推荐。而理想的 AI 时代的「主动推」,是 AI 理解记忆后,直接为用户创造出一个量身定制的解决方案、信息简报,是完全基于用户意图的「个性化的信息聚合」,它更多是基于生成式的。

GUI Agent 只是一个技术方案,最终要回到「解决用户什么样的需求」这个问题上。比如用户希望用手机点外卖、点咖啡。用户并没有那么关心是用 GUI Agent 的方式还是 API 的方式。

仅能够操作手机的 AI 肯定不是 AI 手机的最终形态,如何让手机上的 AI 真正用好记忆才是厂商真正应该思考的。很期待各大厂商如何能够把记忆和 AI 真正结合起来。拥有记忆而且能够操作手机的 AI,才真正配得上叫「AI 手机」。

53AI,企业落地大模型首选服务商

产品:场景落地咨询+大模型应用平台+行业解决方案

承诺:免费POC验证,效果达标后再合作。零风险落地应用大模型,已交付160+中大型企业

联系我们

售前咨询
186 6662 7370
预约演示
185 8882 0121

微信扫码

添加专属顾问

回到顶部

加载中...

扫码咨询