支持私有化部署
AI知识库

53AI知识库

学习大模型的前沿技术与行业应用场景


如何设计 AI 与人的交互?以及为什么真正的创新必然是集中式的?

发布日期:2025-05-15 12:12:06 浏览次数: 1532 作者:谭少卿
推荐语

探索AI交互设计精髓,揭秘产品创新的核心思路。

核心内容:
1. AI与人交互设计的关键要素
2. 产品设计中召回率与精确率的平衡
3. 集中式创新对产品创新的重要性

杨芳贤
53A创始人/腾讯云(TVP)最具价值专家


?

真正的产品创新不可能靠跨部门协作,只能是集中式创造。

先上“暴论”,在结尾会点题。
因为我们不需要模棱两可的漂亮话,我们需要观点的锋利。否则分享的意义就丢失了,何谈思想的交锋。


?

文章结构:

一、我们先谈如何设计 AI 与人的交互

二、更好的设计是什么

三、为什么“真正的产品创新不可能靠跨部门协作,只能是集中式创造。”

四、后记&彩蛋

五、联系方式



我们先谈如何设计 AI 与人的交互。

这个话题很大,所以这篇文章还是举例说明,尝试说清楚中间的一个点。
现有的产品不过多讨论,否则就像这篇文章一样《Fellou 不是 AI 浏览器!Fellou 更不是 Manus》,容易被误解为“广子”,而错过了内容。
所以,我们直接举之前的例子,以 Google Photo 和 iOS 相册为例,这曾经是我多年前面试 AI 产品经理的经典题目。如果严谨一点,当时招的叫智慧产品的产品经理。
举这个例子是因为大家可能或多或少这两个产品或者类似的产品,也就是在相册里的输入框,输入关键词,搜索照片。可能是搜猫、搜狗、或者是搜某天跟朋友的合影。
同一个功能,二者的区别在哪里?你可能会发现,如果你拍了很多狗狗的照片,你在 iPhone 里边输入“狗”,能搜到不少狗狗,但是可能有些搜不出来。而搜不出来的这些狗狗,可能是因为拍糊了,或者它看起来可能像个猴子,比如我喜欢的猴面梗,它甚至像个小狮子、或者“小恶魔”,如下图。

Image
Image

总之,它看起来不是那么像大部分狗狗。
但如果你在 Google Photo 里边搜索“狗”,你可能会发现,它基本上能把狗狗都搜给你。但可能它也会把你的毛绒玩具、甚至小狮子的屁股照片搜给你。
所以这二者在产品设计的倾向上是有显著区别的。这个区别是什么?
我们都知道,在检索类的产品里,有两个经典的技术指标。做 RAG 也是一样的,需要看这两个指标。
即召回率(Recall)和精确率(Precision)。维基百科的解释如下。
Image
?

召回率(Recall/查全率)=检索到的 正确目标数量 ÷ 全部目标数量

精确率(Precision/查准率)=检索到的 正确目标数量 ÷ 检索返回的总数量

召回率也可以叫查全率,精确率也叫查准率,名字上更容易理解。我们举例子形象一点说,

所以,可以理解为,查全率说的是,你相册里有一百张狗狗的照片和一堆猫的照片,没有其他的。如果系统给你查到了 100 张狗狗,那就是最好。此时,查全率 = 100 / 100 = 100 %,查准率也是 100%。

即便同时把 10 张猫也捞上来,召回率依旧是 100 %,但此时查准率仅是100 / (100 +10) ≈91 %,因为它只看漏没漏真狗,查得全不全。

但如果你查到了 90 张狗狗的照片,有 10 张狗狗没找到,那就差点。此时,查全率 = 90 / 100 = 90 %(漏掉了 10 张,不全)但查准率可能是 100%,只要这 90 张都是狗狗。

?

查准率呢,如果系统给你查到了 90 张照片,且这 90 张都是狗狗,此时查准率 = 90 / 90 = 100 %(即便还有 10 张狗没有捞上来,查准率也是 100%,它只关心捞上来的准不准),但查全率只有 90%

如果给你查到了 90 张,但是 90 张里边还有 10 张猫的照片,只有 80 张是真的狗狗,那就不好。查准率 = 80 / 90 ≈ 89 %(因为混进了 10 张猫),查全率也只有 80%

如下表。
场景

系统返回内容

召回率

精确率

发生了什么

S

只有100 张真狗

100%

100%

真狗全找出来了,找出来的全是真狗

A

100 张真狗 + 10 张猫

100%

91%

一只狗没漏,但四张里三张是猫

B

90 张真狗(无猫)

90%

100%

漏了 10 只狗,却张张都准

C

80 张真狗 + 10 张猫

80%

89%

又漏又混,双指标都降

也就是说,召回率关心:真狗有没有被全部捞上来?精确率关心:捞上来的是不是都是真狗?
显然,模型的目标一般是不断优化自己,使二者同时提升,达到最佳状态。
但现实世界里,如果模型能力等其他条件不变,仅通过调整置信度阈值来控制的时候,这二者在一定程度上,是此消彼长的关系,想“一个都不能漏”,就得把网撒得更大,难免混进猫;想“只要真狗”,就得收紧网眼,可能漏掉边缘的狗狗。

仅阈值调整方式

召回率 (Recall)

精确率 (Precision)

降低阈值 / 网眼放大

↑(漏检更少)

↓(误检增多)

提高阈值 / 网眼收紧

↓(漏检增多)

↑(误检减少)

这两个指标像是跷跷板的两头,这边高了那边就低了,我们称之为跷跷板效应。这在“检索”这种场景里是常见的现象。
所以最终怎么调节,要看业务场景。想“一个都不能漏”时倾向提高 召回率;想“只要真狗”时倾向提高 精确率。
那么,我们回到正题。
你可以想象一下,如果你来设计 iOS 相册或者 Google Photo 这类产品,在相册里边,输入文字搜索照片这个场景里,既然是存在跷跷板效应,你该怎么抉择呢?
如果你没想过这个问题,你可以停一下想想看,再往下看。
我们先公布他们的做法。然后你来决定谁做得好,谁做得不好。
iOS 相册,整体采用的是精确率优先。而 Google Photo 采用的是召回率优先。优先的意思是说,这边高一点,但那边也别掉太低了。
谁做得好?你可以先来当裁判试试。
我们旗帜鲜明地说,在这里,Google 是对的,Apple 做得不好。
?

为什么?因为在搜索这个场景里边,用户最需要的是搜到照片。即便有一些猫猫、毛绒玩具混进来,对用户没有显著的损失,因为既不影响你看狗、也不影响你分享,并且如果你要制作图册,你把非狗的部分删掉就好了。

但是如果有些狗狗没有搜出来,你是难以接受的,难道是对它的爱不深沉了没拍到,还是自己的记忆出现了错误当时没有拍,甚至会怀疑是不是误删除了照片?因为大部分用户并不知道产品背后的设计逻辑。他们会认为自己出了问题。

对,Apple 在这里可能是延续了自己一贯的设计风格“不要出错”,而 Google 延续了自己做搜索的风格,“多找点”。
但背后其实隐含了一个问题,那就是我们需要给用户做多少设计?我们作为工具和内容的生产者、作为产品开发者、作为交互设计者,一定是对的吗?我们应该完全为用户做决策吗?或者说,我们应当完全为用户做“主”吗?
更进一步,这个隐含的问题是,生产者应当如何进行更好的设计?把哪些交互过程交给用户?应当假设用户没有自己更懂他们吗?
对于当前的 AI 产品设计、 Agent 的设计,这个问题更是普遍的存在。
哪些交给 AI?哪些交给用户?如何与用户互动?如何更优雅的互动?
在 AI 能力越来越强大的今天,相信产品开发者逐渐认识到了“Less Structure, More Intelligence”。但我们就因此需要假装 AI 无所不能,比你更了解你自己吗?如果不是,那么自然也不必认为让用户确认需求、说明白自己的愿望、说明白自己的约束条件,是一种丑陋的设计。视觉上的丑陋或者优雅是可以被设计的,但是能力上假装 AI 无所不能则是傲慢的。这一点,在已经跑起来的很多优秀项目上,其实已经得到了改进,只是可以更好。
回到相册的这个案例,难道跷跷板原则的存在,我们做到 Google Photo 这样就足够好了嘛?

更好的设计是什么?

就考虑在手机相册上输入短文字搜图这个具体的场景。我们用一段话呈现一个更好的设计在这里,因为很简单,就不让 AI 生成交互 demo 了。

1、在用户输入文字后,查询的第一屏(或者头两屏),采用精确率优先的策略,也就是说,尽可能保障搜到的都是真狗。

2、然后在第二屏(或者第三屏)往后,逐步采用召回率优先的策略。直到精确率下降到明显伤害了体验,可以有一个向下的点击询问用户,“是否要扩大搜索,找到尽可能多的狗狗照片”。这个询问的动作,甚至也可以发生在用户往下翻屏幕的速率太快上触发。

3、更进一步,甚至可以在检索数量过少的时候,主动提示用户是否补充搜索信息、扩大搜索范围或者想搜索的其实是别的。而这些操作也都可以设计得很“人性化”。

4、考虑到我所提出的,好的 AI 产品应当主动构建“Profile、Preference、Context”三要素,理解用户档案、偏好、情境,并设计、收集好一些信号的反馈,进而实现更智慧、更个性化、更情景化的,以及更人性化的服务,其实用户体验的提升是没有止境的。详见 # AI产品的设计 系列文章

是的,与用户交互并不会显得自己产品很傻,反而是优雅的。只不过这种交互并不像有些产品设计那样:
“我把召回率和精确率做一个控制条,让用户自己拉不就好啦?”
“我把精确率优先还是召回率优先,做一个二选一的选项给用户不就好了?”
那这跟 ChatGPT 把一堆模型放到左上角让用户自己选用哪个有什么区别?
那这跟 ChatGPT 把用户 Retry 的时候选择哪个模型交给用户自己搞有什么区别?
注:以上 Google Photo 和 iOS 相册的策略取向,是早年前的感受,当前他们是否做了优化,可以重新审视一遍。

真正的产品创新不是靠跨部门实现的,只能是集中式的。而 AI 产品的设计为什么需要集中式?为什么要靠组织创新来推动?

所以,我想我们可以回到开篇了,以一个例子间接回答了那个问题。因为产品体验和流程的设计、交互的设计、指标权衡、方案设计等需要一套快速闭环、快速迭代的非线性协作,传统的过于职业化的分工流程会阻碍智能的涌现。高度优化的用户体验,不是产品经理、UX 设计师、UI 设计师、用户调研、技术研发等任何一个人的事情,何况在传统的分工里,他们各司其职,缺乏频繁的、深入的、彼此信任的交流和共创。
用户体验的极致从来不是某个角色的独奏,而是多角色的即兴合奏。要让 Jam Session 流畅,就必须把人凑到一起、把墙拆掉。用真正的 OKR 而不是伪装成 OKR 的 KPI。
不要把手段当做目的,不要把技能当做职业。——《AI 帮你赢》

后记&彩蛋

文中吐槽了一把 ChatGPT 的产品设计,可能有一个回应是“OpenAI 是一家 focus 在底层模型能力上的公司,是去 AGI 的,产品设计无所谓不需要浪费资源”。我贴一个链接,是我跟元宝聊的这个相册设计的面试题。它答得很快,而且方向很对。只要问题是对的,答案就不会太远,可以看这里。
当然,在多模态大模型的驱动下,体验可以不再依赖我们在“更好的设计是什么”里边给出的方案。因为那依旧是预设的交互。它可以更智能。但整个系统的设计,依然有人为的选择在里边。
昨天跟文锋、面面聚餐,顺便聊到了 AI/Agent 产品设计这个话题。以此文为记。此外,还聊到了一个话题,战略上避虚击实,战术上避实击虚。一家之言,以后可以展开。
另外,还把上篇文章《我教 Apple 做 Agent》里边的一个快捷指令更新了,确实好用,所以更新出来。能够在任意界面(比如微信)双击手机,自动帮你创建日程,然后 iOS 会实时计算你的出发时间等。继刚说因为这个指令,已经换回 iOS 原生日历了,原生的生态只要用心,体验一定是可以很棒的。接下来就看苹果发布的 AI 功能,按不按我写的剧本来演了。

Scan me!

联系方式

如果希望和我交流讨论,或参与相关的讨论群,请加微信,联系方式请点击 【联系方式 2025】。
这是《AI 产品的交互设计第六篇》,更多 AI 产品交互设计系列文章:
一、《浅谈 AI 产品的交互设计以及 Agent 演进路线》
二、《【预见 UI】AI 产品交互设计理念的提出以及分级》
三、《【与万物对话】通往 AI 交互 L3 之路——Chat‑as‑OS 的产品设计探索》
四、《Fellou 不是 AI 浏览器!Fellou 更不是 Manus。》
五、《我教 Apple 做 Agent》
六、《对生成式人工智能的一些思考[其一]》
<未完待续>


53AI,企业落地大模型首选服务商

产品:场景落地咨询+大模型应用平台+行业解决方案

承诺:免费场景POC验证,效果验证后签署服务协议。零风险落地应用大模型,已交付160+中大型企业

联系我们

售前咨询
186 6662 7370
预约演示
185 8882 0121

微信扫码

添加专属顾问

回到顶部

加载中...

扫码咨询