贝叶斯的博弈:数学、思维与人工智能
上QQ阅读APP看书,第一时间看更新

统计学课本讲了什么

我们来看看现代著名统计学课程的教材,里边有些有趣的东西。统计学家拉里·沃瑟曼在他的教材里写道:“观察研究的结果只有当以下条件都满足时才开始变得可信:(一)结果在数个研究中被重复,(二)每个研究都控制了可能的混杂因素,(三)因果联系的存在有一个言之有理的科学解释。”

我们之后会谈到混杂因素,现在你只需要知道它给 值的缺陷又加上了一重令人生畏的困难。

我想要强调一下在沃瑟曼的描述中那种艺术式的模糊。上文中的引语由大量模糊的词语组成,比如“开始变得可信”“数个研究”“可能”“言之有理”“科学解释”“因果联系”,等等。这是有意而为的,而且这些词语的意义依赖于如何解释。“可信”这个词似乎甚至在邀请我们投入贝叶斯主义的怀抱!

请注意,我这样说不是为了批评拉里·沃瑟曼或者他的教材。他的教材非常出色。实际上,似乎所有频率主义的优秀教材都强调了这种艺术式的模糊,而且强调在解释统计数据时需要谨慎。

然而,这种艺术式的模糊也给科学带来了不干不脆的印象。如果过于谨慎,人们就很可能认为任何事物都无法摆脱所有合理怀疑,这会让某些人怀疑疫苗的好处、全球气候变暖以及烟草对健康的危害。就算是我,当某位科学家说证明了希格斯玻色子的存在时,或者说他毫不怀疑这个宇宙遵循量子力学的时候,我还是有种不舒服的感觉。我们的纯粹贝叶斯主义者也是这样。

我们需要一种更合适的语言来描述我们说出的各种断言的程度各异的确定性或置信度。这种语言的初步版本,或者说简化版本,就是“言之成理”“可信”“高度可能”和“超越合理怀疑”。描述这些置信度更严谨的方法必然是某种类似(甚至同构)于贝叶斯概率的语言。