频率主义海洋中的贝叶斯孤岛
战争之后,“贝叶斯”这个术语仍然是一种侮辱。在 20 世纪 50 年代,一位美国统计学家半开玩笑地说某位同事是“反对美国的,因为他是贝叶斯主义者,而贝叶斯主义会让美国政府失去威信”。另一位统计学家补充说:“贝叶斯主义统计学家还不够贝叶斯。如果他们追随贝叶斯的脚步,只在死后发表文章的话,我们就能避免很多问题了。”大学中的统计学系对贝叶斯主义的反对尤为深切。在战争中与图灵并肩使用贝叶斯公式的杰克·古德曾经尝试弘扬贝叶斯方法的好处,但人们一次又一次对他的话充耳不闻。
贝叶斯的火焰却在远离学院的地方重新燃起,这要归功于亚瑟·贝利这位富有魅力的美国精算师。估算人的一生中的随机事件对于决定保险价格来说至关重要。某项风险的概率越大,为这项风险提供保障的代价就越大,所以保险价格也应该越高。然而,这些概率并非基于费希尔的 值,而是通过某些难以理解的公式计算而来的。知道这些公式来源的精算师十分稀少,但所有人都察觉到这些公式都会给出一致的结果。精算师的计算很有效,但没有人知道为什么!受频率主义学派训练的贝利对此相当震惊。
然而,贝利最终发现这些奇怪的精算公式,比如我们在之后的章节中会看到的神奇公式,与贝叶斯公式有着神秘的相似之处。在经过一年的怀疑之后,贝利最终拥抱了作为保险定价基础的这些类贝叶斯式的推断方法,甚至将自己接受的频率主义教育抛诸脑后,发起了反对费希尔方法的运动。1950 年,贝利发表了一篇论文,将作为精算基础的信度理论与拉普拉斯、普赖斯和贝叶斯的工作联系在了一起。他在文章中高度赞赏了主观概率的概念,宣布频率主义的“暴政”将会终结。不幸的是,在打出反对费希尔的旗帜不久之后,贝利就因为心血管疾病去世了。
还有两个半学者有着贝叶斯式的思考方式。我们先从那半个贝叶斯主义者说起。在第二次世界大战之前,安德烈·柯尔莫哥洛夫在 1933 年最终提出了一套公理,可以作为概率论的基础。对于柯尔莫哥洛夫来说,最重要的不是对概率意义的诠释,而是处理概率的规则。但即使柯尔莫哥洛夫自称倾向于频率主义,当他被迫将其概率理论应用到军事策略中时,他所发展出的一种推理方法,与一个世纪以前贝特朗的方法完全一致。
在第二次世界大战之后,概率论的数学形式化让丹尼斯·林德利和伦纳德·萨维奇开始否定费希尔的频率主义统计学。与之相对的是,贝叶斯公式是柯尔莫哥洛夫公理的直接推论,因此它在数学上有着坚实基础。此外在 1958 年,林德利发表了一篇论文,证明了被称为“信念推断”的一种费希尔的概率推断方法自相矛盾。林德利敢于拒绝向费希尔俯首称臣,他是正确的。由此大获全胜后,林德利成了倡导贝叶斯主义的活跃分子,宣称所有统计都是贝叶斯公式的某种特殊情况或近似,并在英国建立了数个偏向贝叶斯主义的统计学系。
轮到萨维奇了,他在 1954 年出版了《统计学基础》(The Foundations of Statistics),在书中他对概率的主观诠释进行了辩护。萨维奇与其他人不同的地方在于,他将贝叶斯公式当作“救世主”。萨维奇并不像其他人那样认为贝叶斯公式不过是众多推理工具之一。对他来说,贝叶斯公式就是唯一的推理工具。正确的推理就是根据贝叶斯公式进行的计算,而所有妥协都是非理性的(但有可能在实用主义上是合理的)。萨维奇对贝叶斯主义有着宗教般的信仰。
当人们问萨维奇这会不会给科学的客观性带来疑问时,他的回答是,客观性就是科学共同体中涌现出的共识,当积累的数据足够多时,这种共识就会出现。然而,萨维奇也补充道,这也是定义客观性的唯一方式。对于萨维奇来说,频率主义的方法并不客观,因为这些方法总是需要对统计结果进行解释,甚至对频率主义具体方法加以选择。此外,费希尔对统计分析的客观化尝试,尤其是他的信念推断,最终还是“一种顽固的尝试,想煎出贝叶斯的煎蛋,又不想打破贝叶斯的鸡蛋”。可叹的是,像贝利一样,正当推广贝叶斯主义的运动如火如荼之际,萨维奇死于了心血管疾病。