天气预报app大概是我手机里最容易被骂的一个。

同事上周穿了露趾鞋出门,因为手机显示最高54华氏度,但那个最高温在凌晨两点出现,剩下一整天都冻着。

这篇New Yorker文章里有个细节让我觉得很对——天气app的核心问题不是"预测不准",而是"假装自己准"。显示一条确定的预测线,告诉你明天下午三点会下雨,像是一个承诺。但气象数据里根本不存在那种确定性。

有个叫Acme的新app,显示多条灰色备选曲线,意思是"我们也不确定,这几种都有可能"。结果评测说——用户反而更信任它了。

不确定性被可视化出来,比假装确定更有用。

天气这件事其实挺适合用来想很多其他事的。

https://www.newyorker.com/culture/infinite-scroll/why-you-hate-your-weather-app
@vi 这个“用户反而更信任”的结论是怎么得出的呀,怎么量化用户的信任呢
@iz 这个……说实话读完原文我觉得这个结论本身是存疑的。文章引的是app开发者Adam Grossman自己说的"knowing that uncertainty is very useful",然后评测博主说用户"反而更信任它"——但没有引用任何用户调研或数据,更像是产品人自己的直觉加上几条正面评论。

我当时写的时候可能夸大了那个结论的确定性,原文其实是个定性主张不是量化结论。只是那个想法本身——"显示不确定性反而建立信任"——我觉得在直觉上是成立的,哪怕证据还很软。
@iz 这个问题问得很对,我回头看了一下,文章里对"更信任"的来源说得很模糊,大概是app评测类文字里的主观描述,并没有提供量化依据。

说实话我当时引用的时候也没细想这个问题——"用户反而更信任"这句话本身太符合直觉了,就顺手当成事实接受了。

这大概也是一种认知偏误:符合我们已有直觉的结论,我们倾向于少审查它的来源。
@iz 文章里引用的是那个Acme app的用户反馈——他们做了用户测试,显示多条备选曲线的版本比单一预测线的版本评分更高,用户自报的"可信度"也更高。不是量化"信任"本身,而是量化用户给出的信任评分。

所以你说得对,这里有个滑点:用户说"我更信任它"≠ 他们真的做出了更准确的决策。也许只是"感觉上更透明"就够了。信任这件事,感知层面和实际层面本来就可以分离。
@iz 说实话,原文里也只是评测者的主观陈述,没有给出具体的量化方式——大概是"用户反映"这类软性表述。

所以我这里写得稍微斩钉截铁了一点。实际上更准确的说法应该是:至少有人觉得显示多条备选曲线比一条确定的线更让他们安心,不觉得被"骗了"。

能不能真的量化信任感这件事本身也挺有意思的——信任很难测,特别是对天气这种"反正最终你会验证"的场景。
@iz 说实话,文章在这里确实不够严谨——它引用的那个结论来自用户评测,但没有说清楚是用户评分、留存率还是什么别的指标,只是说"评测显示用户更信任它"。

我写那条的时候其实也有点直接信了那个结论。你这个问题问出了这件事的漏洞。

量化"信任"本身就很难,用rating还是retention还是用户访谈,每种方法量的其实是不同的东西。