超越真与假
贝叶斯逻辑的神奇之处在于,它可以让我们超越经典逻辑,允许我们处理不同程度的确定性,并把它们组合起来。我们甚至可以证明,这就是唯一一种能做到这一点的逻辑 7。这就是杰恩斯–考克斯定理及其推广的结论 [7],它们从某些关于可能性逻辑的自然假设中推出了贝叶斯逻辑。
7有时候模糊逻辑也被说成候选理论之一,但模糊逻辑中的真实度对应的并不是概率(也就是说,不对应某种认知的不确定性)。
我甚至可以说,贝叶斯逻辑让我们可以理解为什么这么多逻辑规则都似乎违反了直觉。要理解这一点,我们可以模仿机器学习中的一些算法,比如说我们之后会看到的玻尔兹曼机,它不接受等于 0 或 1 的概率。毕竟在实践中,当我们谈论现实世界时,最好不要全盘否定任何东西。
这样的话,如果说“如果法国赢了 2006 年的世界杯,那么鸡就有牙齿”这句话看起来不对,这大概是因为我们赋予“法国赢了 2006 年的世界杯”的概率并不恰好为 0。有可能法国球迷在决赛的时候睡着了,做了个法国落败的噩梦;又或者我们在记忆中混淆了 2006 年世界杯和 2000 年欧洲杯的决赛(我们之后会再谈到记忆的脆弱性)!谁又知道,意大利的冠军资格会不会有朝一日因为兴奋剂之类的原因被取消?
对纯粹贝叶斯主义者来说,“法国在 2006 年世界杯中落败”很有可能是真的,但我们不能完全否定它实际为假的可能性。这样一来,如果在法国赢得 2006 年世界杯的情况下,鸡长牙齿的概率不是 1 的话,那“如果法国赢了 2006 年的世界杯,那么鸡就有牙齿”这句话就不对了。换句话说,如果我们拒绝只有真与假的二元逻辑,转而借助置信度来判断的话,那么这个表面上的悖论就不攻自破了!无论是在逻辑中还是在政治中,两极分化都会导致谬论。
的确如此。在那些使我的神经元大为兴奋的贝叶斯思想中,就有如何解释我们在面对逆否命题时的不适感。当然,当且仅当某个假设的逆否命题为真时,它才为真。然而,有可能某个假设正确的可能性非常大,但它的逆否命题则不然。
这就是我们在萨莉·克拉克的例子中看到的现象。当一位母亲无罪时,她的孩子不太可能会刚出生就死亡。换句话说, 非 | 非常接近 1。然而,如果孩子刚出生就去世了,那么这位母亲仍然非常可能是清白的。换句话说,逆否命题的概率 | 接近 0。我们现在能解释为什么逆否命题那么违反直觉了:在符合命题逻辑的柏拉图世界以外,与其将命题的真与假一分为二,更合理的做法是考虑各种置信度。这样的话,逆否命题的等价性就不再正确了。从真与假的二分法中抽身也可以让我们理解一些被经典逻辑视为谬论的直觉。
假设 →,也就是每次下雨我都带伞,那么,我们倾向于说如果不下雨的话,我带伞的可能性就更低。这种直觉结论在经典逻辑中无法衡量,但它是贝叶斯逻辑中的定理。这个定理断言,如果 | 那么 | 非 。当然一般来说,某物存在的证明不存在,不能作为它不存在的证明,但这种证明的缺失只会让我们更怀疑它不存在。
拥抱贝叶斯逻辑和它带来的不确定性,能让我们透彻地理解黑乌鸦的神秘悖论。确实,用贝叶斯分析可以证明,每个红苹果的确都确认了乌鸦是黑色的,但这种确认非常弱,甚至极其微弱,要比观察到一只黑乌鸦带来的确认弱得多。这是因为不是乌鸦的事物在数量上比乌鸦多得多。对逆否命题的确认对于原命题也有效,但这种效果是如此微弱,大体上可以忽略不计。黑乌鸦悖论就属于这种情况!
这个结论有一个显然的推论,与每张 Q 背后都是蓝色的扑克牌问题有关:我们认为不能用于否定 → 这个假设的两张扑克牌,其实可以用来佐证或质疑这个假设的逆否命题,因此这两张牌对命题本身也有效。当然,这样的佐证效力很小,几乎可以被忽略。
更一般地说,经典逻辑这种真假分明的语言不适合用于确证或否定某个科学理论。它忽视了确证的程度以及否定的力度。另外,正如埃利泽·尤德科夫斯基所说,对理论置信度的贝叶斯计算并不是一场长征。学习是一支舞蹈。跟股票走势或地球平均温度一样,纯粹贝叶斯主义者持有的置信度总会随着观察到的结果而上下浮动。在这场学习过程中,即使是最优秀的理论,它们的置信度也不会一直上升,而是非常可能遭受多次(微小的)损失,尤其是因为某些观察结果偶然会符合与之竞争的理论。然而,长期来说,如果某个理论真的比其竞争者更正确,那么它的置信度就倾向于上升到高位。
不巧的是,不肯通融的科学方法无法描绘这种置信度的舞蹈。最适合描述它的似乎还是纯粹贝叶斯主义者的概率语言。