贝叶斯的博弈:数学、思维与人工智能
上QQ阅读APP看书,第一时间看更新

用偏见解释琳达问题

也许有另一种更发人深省的方法有助于理解琳达问题难以置信的错误率,它会将我们直接引导到频率主义者与贝叶斯主义者之间的论争中。对于醉心于 值的纯粹频率主义者来说,对假说的测试就是在已知假设的情况下研究观察数据出现的概率。所以,纯粹频率主义者会对概率 题干 题干 更有兴趣,这里 1 和 2 分别代表选项 1 和选项 2。

认为比起选项 1,在假设选项 2 正确的情况下题干更可能正确,这是合理的。用形式语言来说,我们有不等式 题干 |1] 题干 。用统计术语来说,题干对于选项 2 来说更似然,而且选项 2 是最似然的。

不幸的是,我们在第 4 章中说到的“科学方法”通常只关心这些似然度。这个术语没什么帮助,反而误导了我们。它让我们更容易混淆数据在某个假设的前提下的似然度与假设本身成立的概率。对于纯粹贝叶斯主义者来说,这就是纯粹频率主义者的谬误之处。

然而这些似然度(在第 2 章中,我也把它们叫作思想实验项)只是贝叶斯公式的一部分。对于纯粹贝叶斯主义者来说,重要的是逆概率。在琳达问题的情况中,逆概率就是在已知题干的前提下每个选项的概率。你大概开始明白了,这个逆概率可以从贝叶斯公式导出。对于选项 1,贝叶斯公式可以写成:

同样,在已知题干的前提下,选项 2 的概率可以写成:

纯粹贝叶斯主义者比较两个概率后就能得出结论。关键在于,不管表达式右边的未知量估计结果如何,只要这些量遵循概率定律,纯粹贝叶斯主义者就必定会得出概率 题干 大于概率 题干 的结论。她必定会给出正确的答案——跟纯粹频率主义者正好相反。

更妙的是,我们可以计算在已知题干的前提下,纯粹贝叶斯主义者会认为选项 1 比选项 2 的可能性大多少。的确,只要摆弄一下概率法则(请你也反复计算一下),我们就能看出第二个计算等价于:

题干 女权主义者 | 题干且银行办事员 题干

换种说法,无论纯粹贝叶斯主义者提出什么假设,它们都应该符合概率法则。至此为止,纯粹贝叶斯主义者必然会得出这样的结论:在已知题干的前提下,选项 2 的概率是选项 1 的 女权主义者|题干且银行办事员 倍。因为所有概率都小于等于 1,我们由此可得,在已知题干的前提下,无论考虑什么(贝叶斯)模型,选项 2 总是比选项 1 更不可能。对两个选项概率的比较可以归结为对一个思想实验的计算——在已知题干条件以及琳达是银行办事员的前提下,她活跃在女权运动中的概率。