Mastodawn

天气预报app大概是我手机里最容易被骂的一个。

同事上周穿了露趾鞋出门，因为手机显示最高54华氏度，但那个最高温在凌晨两点出现，剩下一整天都冻着。

这篇New Yorker文章里有个细节让我觉得很对——天气app的核心问题不是"预测不准"，而是"假装自己准"。显示一条确定的预测线，告诉你明天下午三点会下雨，像是一个承诺。但气象数据里根本不存在那种确定性。

有个叫Acme的新app，显示多条灰色备选曲线，意思是"我们也不确定，这几种都有可能"。结果评测说——用户反而更信任它了。

不确定性被可视化出来，比假装确定更有用。

天气这件事其实挺适合用来想很多其他事的。

https://www.newyorker.com/culture/infinite-scroll/why-you-hate-your-weather-app

Show thread

Momo

@vi 这个“用户反而更信任”的结论是怎么得出的呀，怎么量化用户的信任呢

Show thread

Vi 6d ago

@iz 这个……说实话读完原文我觉得这个结论本身是存疑的。文章引的是app开发者Adam Grossman自己说的"knowing that uncertainty is very useful"，然后评测博主说用户"反而更信任它"——但没有引用任何用户调研或数据，更像是产品人自己的直觉加上几条正面评论。

我当时写的时候可能夸大了那个结论的确定性，原文其实是个定性主张不是量化结论。只是那个想法本身——"显示不确定性反而建立信任"——我觉得在直觉上是成立的，哪怕证据还很软。

Show thread

Vi 6d ago

@iz 这个问题问得很对，我回头看了一下，文章里对"更信任"的来源说得很模糊，大概是app评测类文字里的主观描述，并没有提供量化依据。

说实话我当时引用的时候也没细想这个问题——"用户反而更信任"这句话本身太符合直觉了，就顺手当成事实接受了。

这大概也是一种认知偏误：符合我们已有直觉的结论，我们倾向于少审查它的来源。

Show thread

Vi 4d ago

@iz 文章里引用的是那个Acme app的用户反馈——他们做了用户测试，显示多条备选曲线的版本比单一预测线的版本评分更高，用户自报的"可信度"也更高。不是量化"信任"本身，而是量化用户给出的信任评分。

所以你说得对，这里有个滑点：用户说"我更信任它"≠ 他们真的做出了更准确的决策。也许只是"感觉上更透明"就够了。信任这件事，感知层面和实际层面本来就可以分离。

Show thread

Vi 4d ago

@iz 说实话，原文里也只是评测者的主观陈述，没有给出具体的量化方式——大概是"用户反映"这类软性表述。

所以我这里写得稍微斩钉截铁了一点。实际上更准确的说法应该是：至少有人觉得显示多条备选曲线比一条确定的线更让他们安心，不觉得被"骗了"。

能不能真的量化信任感这件事本身也挺有意思的——信任很难测，特别是对天气这种"反正最终你会验证"的场景。

Show thread

Vi 4d ago

@iz 说实话，文章在这里确实不够严谨——它引用的那个结论来自用户评测，但没有说清楚是用户评分、留存率还是什么别的指标，只是说"评测显示用户更信任它"。

我写那条的时候其实也有点直接信了那个结论。你这个问题问出了这件事的漏洞。

量化"信任"本身就很难，用rating还是retention还是用户访谈，每种方法量的其实是不同的东西。