我要投稿

如何设计 AI 与人的交互？以及为什么真正的创新必然是集中式的？

发布日期：2025-05-15 12:12:06 浏览次数： 1918

作者：谭少卿

微信搜一搜，关注“谭少卿”

真正的产品创新不可能靠跨部门协作，只能是集中式创造。

先上“暴论”，在结尾会点题。

因为我们不需要模棱两可的漂亮话，我们需要观点的锋利。否则分享的意义就丢失了，何谈思想的交锋。

文章结构：

一、我们先谈如何设计 AI 与人的交互

二、更好的设计是什么

三、为什么“真正的产品创新不可能靠跨部门协作，只能是集中式创造。”

四、后记&彩蛋

五、联系方式

我们先谈如何设计 AI 与人的交互。

这个话题很大，所以这篇文章还是举例说明，尝试说清楚中间的一个点。

现有的产品不过多讨论，否则就像这篇文章一样《Fellou 不是 AI 浏览器！Fellou 更不是 Manus。》，容易被误解为“广子”，而错过了内容。

所以，我们直接举之前的例子，以 Google Photo 和 iOS 相册为例，这曾经是我多年前面试 AI 产品经理的经典题目。如果严谨一点，当时招的叫智慧产品的产品经理。

举这个例子是因为大家可能或多或少这两个产品或者类似的产品，也就是在相册里的输入框，输入关键词，搜索照片。可能是搜猫、搜狗、或者是搜某天跟朋友的合影。

同一个功能，二者的区别在哪里你可能会发现，如果你拍了很多狗狗的照片，你在 iPhone 里边输入“狗”，能搜到不少狗狗，但是可能有些搜不出来。而搜不出来的这些狗狗，可能是因为拍糊了，或者它看起来可能像个猴子，比如我喜欢的猴面梗，它甚至像个小狮子、或者“小恶魔”，如下图。

总之，它看起来不是那么像大部分狗狗。

但如果你在 Google Photo 里边搜索“狗”，你可能会发现，它基本上能把狗狗都搜给你。但可能它也会把你的毛绒玩具、甚至小狮子的屁股照片搜给你。

所以这二者在产品设计的倾向上是有显著区别的。这个区别是什么

我们都知道，在检索类的产品里，有两个经典的技术指标。做 RAG 也是一样的，需要看这两个指标。

即召回率（Recall）和精确率（Precision）。维基百科的解释如下。

召回率（Recall/查全率）＝检索到的正确目标数量 ÷ 全部目标数量。

精确率（Precision/查准率）＝检索到的正确目标数量 ÷ 检索返回的总数量。

召回率也可以叫查全率，精确率也叫查准率，名字上更容易理解。我们举例子形象一点说，

所以，可以理解为，查全率说的是，你相册里有一百张狗狗的照片和一堆猫的照片，没有其他的。如果系统给你查到了 100 张狗狗，那就是最好。此时，查全率 = 100 / 100 = 100 %，查准率也是 100%。

即便同时把 10 张猫也捞上来，召回率依旧是 100 %，但此时查准率仅是100 / (100 +10) ≈91 %，因为它只看漏没漏真狗，查得全不全。

但如果你查到了 90 张狗狗的照片，有 10 张狗狗没找到，那就差点。此时，查全率 = 90 / 100 = 90 %（漏掉了 10 张，不全）但查准率可能是 100%，只要这 90 张都是狗狗。

查准率呢，如果系统给你查到了 90 张照片，且这 90 张都是狗狗，此时查准率 = 90 / 90 = 100 %（即便还有 10 张狗没有捞上来，查准率也是 100%，它只关心捞上来的准不准），但查全率只有 90%。

如果给你查到了 90 张，但是 90 张里边还有 10 张猫的照片，只有 80 张是真的狗狗，那就不好。查准率 = 80 / 90 ≈ 89 %（因为混进了 10 张猫），查全率也只有 80%。

如下表。

场景	系统返回内容	召回率	精确率	发生了什么
S	只有100 张真狗	100%	100%	真狗全找出来了，找出来的全是真狗
A	100 张真狗 + 10 张猫	100%	91%	一只狗没漏，但四张里三张是猫
B	90 张真狗（无猫）	90%	100%	漏了 10 只狗，却张张都准
C	80 张真狗 + 10 张猫	80%	89%	又漏又混，双指标都降

也就是说，召回率关心：真狗有没有被全部捞上来精确率关心：捞上来的是不是都是真狗

显然，模型的目标一般是不断优化自己，使二者同时提升，达到最佳状态。

但现实世界里，如果模型能力等其他条件不变，仅通过调整置信度阈值来控制的时候，这二者在一定程度上，是此消彼长的关系，想“一个都不能漏”，就得把网撒得更大，难免混进猫；想“只要真狗”，就得收紧网眼，可能漏掉边缘的狗狗。

仅阈值调整方式	召回率 (Recall)	精确率 (Precision)
降低阈值 / 网眼放大	↑（漏检更少）	↓（误检增多）
提高阈值 / 网眼收紧	↓（漏检增多）	↑（误检减少）

这两个指标像是跷跷板的两头，这边高了那边就低了，我们称之为跷跷板效应。这在“检索”这种场景里是常见的现象。

所以最终怎么调节，要看业务场景。想“一个都不能漏”时倾向提高召回率；想“只要真狗”时倾向提高精确率。

那么，我们回到正题。

你可以想象一下，如果你来设计 iOS 相册或者 Google Photo 这类产品，在相册里边，输入文字搜索照片这个场景里，既然是存在跷跷板效应，你该怎么抉择呢

如果你没想过这个问题，你可以停一下想想看，再往下看。

我们先公布他们的做法。然后你来决定谁做得好，谁做得不好。

iOS 相册，整体采用的是精确率优先。而 Google Photo 采用的是召回率优先。优先的意思是说，这边高一点，但那边也别掉太低了。

谁做得好你可以先来当裁判试试。

我们旗帜鲜明地说，在这里，Google 是对的，Apple 做得不好。

为什么因为在搜索这个场景里边，用户最需要的是搜到照片。即便有一些猫猫、毛绒玩具混进来，对用户没有显著的损失，因为既不影响你看狗、也不影响你分享，并且如果你要制作图册，你把非狗的部分删掉就好了。

但是如果有些狗狗没有搜出来，你是难以接受的，难道是对它的爱不深沉了没拍到，还是自己的记忆出现了错误当时没有拍，甚至会怀疑是不是误删除了照片因为大部分用户并不知道产品背后的设计逻辑。他们会认为自己出了问题。

对，Apple 在这里可能是延续了自己一贯的设计风格“不要出错”，而 Google 延续了自己做搜索的风格，“多找点”。

但背后其实隐含了一个问题，那就是我们需要给用户做多少设计我们作为工具和内容的生产者、作为产品开发者、作为交互设计者，一定是对的吗我们应该完全为用户做决策吗或者说，我们应当完全为用户做“主”吗

更进一步，这个隐含的问题是，生产者应当如何进行更好的设计把哪些交互过程交给用户应当假设用户没有自己更懂他们吗

对于当前的 AI 产品设计、 Agent 的设计，这个问题更是普遍的存在。

哪些交给 AI哪些交给用户如何与用户互动如何更优雅的互动

在 AI 能力越来越强大的今天，相信产品开发者逐渐认识到了“Less Structure, More Intelligence”。但我们就因此需要假装 AI 无所不能，比你更了解你自己吗如果不是，那么自然也不必认为让用户确认需求、说明白自己的愿望、说明白自己的约束条件，是一种丑陋的设计。视觉上的丑陋或者优雅是可以被设计的，但是能力上假装 AI 无所不能则是傲慢的。这一点，在已经跑起来的很多优秀项目上，其实已经得到了改进，只是可以更好。

回到相册的这个案例，难道跷跷板原则的存在，我们做到 Google Photo 这样就足够好了嘛

更好的设计是什么

就考虑在手机相册上输入短文字搜图这个具体的场景。我们用一段话呈现一个更好的设计在这里，因为很简单，就不让 AI 生成交互 demo 了。

1、在用户输入文字后，查询的第一屏（或者头两屏），采用精确率优先的策略，也就是说，尽可能保障搜到的都是真狗。

2、然后在第二屏（或者第三屏）往后，逐步采用召回率优先的策略。直到精确率下降到明显伤害了体验，可以有一个向下的点击询问用户，“是否要扩大搜索，找到尽可能多的狗狗照片”。这个询问的动作，甚至也可以发生在用户往下翻屏幕的速率太快上触发。

3、更进一步，甚至可以在检索数量过少的时候，主动提示用户是否补充搜索信息、扩大搜索范围或者想搜索的其实是别的。而这些操作也都可以设计得很“人性化”。

4、考虑到我所提出的，好的 AI 产品应当主动构建“Profile、Preference、Context”三要素，理解用户档案、偏好、情境，并设计、收集好一些信号的反馈，进而实现更智慧、更个性化、更情景化的，以及更人性化的服务，其实用户体验的提升是没有止境的。详见 # AI产品的设计系列文章。

是的，与用户交互并不会显得自己产品很傻，反而是优雅的。只不过这种交互并不像有些产品设计那样：

“我把召回率和精确率做一个控制条，让用户自己拉不就好啦”

“我把精确率优先还是召回率优先，做一个二选一的选项给用户不就好了”

那这跟 ChatGPT 把一堆模型放到左上角让用户自己选用哪个有什么区别

那这跟 ChatGPT 把用户 Retry 的时候选择哪个模型交给用户自己搞有什么区别

注：以上 Google Photo 和 iOS 相册的策略取向，是早年前的感受，当前他们是否做了优化，可以重新审视一遍。

真正的产品创新不是靠跨部门实现的，只能是集中式的。而 AI 产品的设计为什么需要集中式为什么要靠组织创新来推动

所以，我想我们可以回到开篇了，以一个例子间接回答了那个问题。因为产品体验和流程的设计、交互的设计、指标权衡、方案设计等需要一套快速闭环、快速迭代的非线性协作，传统的过于职业化的分工流程会阻碍智能的涌现。高度优化的用户体验，不是产品经理、UX 设计师、UI 设计师、用户调研、技术研发等任何一个人的事情，何况在传统的分工里，他们各司其职，缺乏频繁的、深入的、彼此信任的交流和共创。

用户体验的极致从来不是某个角色的独奏，而是多角色的即兴合奏。要让 Jam Session 流畅，就必须把人凑到一起、把墙拆掉。用真正的 OKR 而不是伪装成 OKR 的 KPI。

不要把手段当做目的，不要把技能当做职业。——《AI 帮你赢》

后记&彩蛋

文中吐槽了一把 ChatGPT 的产品设计，可能有一个回应是“OpenAI 是一家 focus 在底层模型能力上的公司，是去 AGI 的，产品设计无所谓不需要浪费资源”。我贴一个链接，是我跟元宝聊的这个相册设计的面试题。它答得很快，而且方向很对。只要问题是对的，答案就不会太远，可以看这里。

当然，在多模态大模型的驱动下，体验可以不再依赖我们在“更好的设计是什么”里边给出的方案。因为那依旧是预设的交互。它可以更智能。但整个系统的设计，依然有人为的选择在里边。

昨天跟文锋、面面聚餐，顺便聊到了 AI/Agent 产品设计这个话题。以此文为记。此外，还聊到了一个话题，战略上避虚击实，战术上避实击虚。一家之言，以后可以展开。

另外，还把上篇文章《我教 Apple 做 Agent》里边的一个快捷指令更新了，确实好用，所以更新出来。能够在任意界面（比如微信）双击手机，自动帮你创建日程，然后 iOS 会实时计算你的出发时间等。继刚说因为这个指令，已经换回 iOS 原生日历了，原生的生态只要用心，体验一定是可以很棒的。接下来就看苹果发布的 AI 功能，按不按我写的剧本来演了

53AI，企业落地大模型首选服务商

产品：场景落地咨询+大模型应用平台+行业解决方案

承诺：免费POC验证，效果达标后再合作。零风险落地应用大模型，已交付160+中大型企业