Python贝叶斯分析(第2版)
上QQ阅读APP看书,第一时间看更新

1.2.1 解释概率

尽管概率论是一个相当成熟和完善的数学分支,但关于概率的诠释不止一种。从贝叶斯的角度看,概率是衡量某一命题不确定性水平的方法。按照这种定义,提出以下问题都是自然且合理的:火星上有生命的概率,电子质量大约为千克,或者布宜诺斯艾利斯在1816年7月9日是晴天的概率。值得注意的是,类似于火星上是否有生命这种问题的答案是二值化的:要么有,要么没有。不过鉴于我们并不知道真实情况,更明智的做法是试图找出火星上存在生命的可能性有多大。该命题取决于我们当前所掌握的信息,而非客观的自然属性。由于这种概率的定义与我们大脑的认知有关,因此人们也常称之为概率的主观定义。不过需要注意的是,具备科学素养的人并不会用其个人信念来回答这类问题。相反,他们会用所有与火星相关的地理数据,以及相应条件下是否适合生命生存的生物知识等来回答这类问题。因此,贝叶斯概率,或扩展到贝叶斯统计,与我们已有的其他成熟的科学方法一样主观(或者客观)。

对于一个问题,如果我们没有相关信息,那么可以说每个可能的事件都有同等的可能性,从形式上讲,这相当于给每个可能的事件分配相同的概率。在没有任何信息的时候,事件的不确定性是最大的。假如某些事件的可能性更高,那么就可以给这些事件赋予更高的概率,相应的其他事件的概率就低一些。请注意,当我们在统计学中谈论事件时,并不局限于可能发生的事情,比如,小行星撞击地球或者我姨妈的60岁生日宴。事件只是变量可以采用的任何可能值(或值的子集),比如,你的年龄大于30岁,或者某品牌巧克力蛋糕的价钱,又或者是2017年全世界卖出的自行车的数量。

概率的概念也常常与逻辑相关。在亚里士多德学派,或者传统的逻辑学派看来,一个命题只能是真或者是假。而在贝叶斯学派所定义的概率中,这些不过是一个特例,一个真的命题所对应的概率是1,而一个假的命题对应的概率是0。当有足够数据表明,火星上存在能够生长、繁殖以及其他符合生命体征描述的生物时,我们才将有火星生命这一命题的概率赋值为1。另外,将一个命题的概率置为0要更为困难一些,因为我们可以猜测:或许某些火星人的足迹还未被勘测到,或者是我们所做的实验有些错误,又或者是某些其他原因导致我们错误地认为火星上不存在生命而实际上是存在的。与此相关的是克伦威尔准则(Cromwell’s Rule),其含义是在对逻辑上正确或错误的命题赋予概率值时,应当避免使用0或者1。有意思的是,Richard Cox在数学上证明了如果想在逻辑推理中加入不确定性,就必须使用概率论的知识。我们很快就会看到,贝叶斯定理只是概率规则的逻辑结果。从另一个角度来看,贝叶斯统计是对逻辑学处理不确定性问题的一种延伸,当然这里没有任何对主观推理的轻蔑。

总的来说,用概率来对不确定性建模,并不一定与自然界在本质上是确定性还是随机性的争论有关,也不一定与主观的自我认知有关。相反,这只是一种对不确定性建模的方法而已。我们认识到,大多数现象很难理解,因为我们面对的是不完整而且充满着干扰的数据,而且还受到由进化塑造的灵长类大脑的限制,以及一些其他原因。因此,我们要采用一种明确考虑了不确定性的建模方法。

提示:从实用的角度来看,本节主要想说明,贝叶斯学派使用概率作为量化不确定性的工具。

我们已经讨论了概率的贝叶斯解释,接下来让我们学习概率的一些数学性质。