2.1 贝叶斯公式
概率的本质是探寻随机事件背后的规律,一般可用公式P(A)表示,意为随机事件A所包含的单位事件的数量与随机变量空间中所有单位事件数量之比,其中随机事件A表示随机事件在总集合中的一个子集。
假定集合O代表所有单位事件的数量f(O),A和B分别代表两个不同随机事件的单位事件数量f(A)和f(B),则有
条件概率是在限定随机事件A的条件下,随机事件B的发生概率。假定随机事件A发生的次数为f(A),在A事件条件下事件B发生的次数为f(C),则条件概率为f(C)/f(A)。
条件概率通过公式表示在限定随机事件A的条件下,随机事件B的发生概率,则有:
在随机事件集合O中,有随机事件A、B,若事件C在随机事件A与B同时发生时才发生,即A和B一同发生的概率为A发生的概率乘以在A条件下B发生的概率。
表示为C⊆A∩B,则随机事件C发生的概率P(C)为联合概率,表示为P(B,A),则有:
公式中,通常情况下概率P(A)和P(B)容易求得,如果得知两个条件概率和两者之一,即可轻易求得第四个概率,因此,常用于通过容易得到的条件概率,推导出较难求得的概率,即为贝叶斯公式。
以条件概率和贝叶斯公式实现机器为例:
假定有英语句子U需要翻译成中文句子V,若英语句子U的翻译结果有V1,V2,V3,…,VN共N种,那只需选择一个翻译结果V,使在已知英语句子U的条件下,V的概率相对其他翻译结果的条件概率最高即可。假如现在句子U有20种翻译方法,分别有各自的条件概率值,这时就要派上贝叶斯公式了。
对若干家生产制造企业的产品质量分析后发现,在过去一段时间内工业产品合格率提高了5%的制造企业中,有占总数70%的制造企业在此期间实施了严格的产品质量监控。同时,在工业产品质量合格率提高幅度不到5%的制造企业中,只有占总数25%的制造企业实施了质量监控。假定工业产品合格率提高5%的概率为8%,那么实施了质量监控将工业产品合格率提高5%的概率是多少?
先定义概率的表示方法:
P(A)——工业产品合格率提高幅度为5%的概率;
P(B)——制造企业实施质量监控的概率;
P——假设制造企业已经实施了质量监控,产品合格率提高幅度为5%的概率;
P——工业产品质量合格率提高幅度5%,制造企业实施了质量监控的概率。
通过贝叶斯公式,可得:
即实施了质量监控系统的产品合格率上涨5%的概率为0.1958。