第四章　大数定律和中心极限定理

§1　大数定律

第一章介绍了频率的稳定性，即当随机试验次数n充分大时，随机事件A发生的频率总是在一个常数p（0≤p≤1）附近摆动；另外，在进行测量时，为了提高测量精度，往往进行多次测量，用测量的实测值的平均值近似代替真值。这正是大数定律的实际背景。

一、契比晓夫（Chebyshev）不等式

设随机变量X的数学期望为E（X），方差为var（X），则对于任意给定的正数ε，有

P{｜X-E（X）｜≥ε}≤var（X）/ε2　　（1.1）

或　　P{｜X-E（X）｜<ε}≥1-var（X）/ε2　　（1.2）

上面两个不等式称为契比晓夫不等式。

仅就连续型随机变量的情形予以证明。

　　证　　

契比晓夫不等式给出了随机变量X的取值落在以其均值E（X）为中心，以ε为半径的区间之外的概率的一个上界估计，通常称此估计为双侧尾概率估计。契比晓夫不等式的长处是它并不依赖于随机变量X的具体概率分布，有宽泛的适用面，但是估计的精度不高。

【例1】　设E（X）=μ，var（X）=σ2，由契比晓夫不等式可得

如果X～N（μ，σ2），那么

可见，知道了随机变量X的具体分布后，双侧尾概率估计将会精确得多。

二、经典大数定律

在精密工件测量的实践中，往往需要反复进行多次测量。如果每次测量没有系统偏差，仅有随机误差，为了抵消每次测量所带有的随机误差，最终测量结果取作各次测量值的平均值。经验表明，只要测量的次数足够多，总可以达到要求的精度。这个过程的数学描述：假定工件的真值为a（永远不可知），第k次测量的结果为随机变量Xk，若各次测量相互独立，每次测量不存在系统偏差（即期望值为真值），则{Xk}是一个独立同分布，均值为a的随机变量序列。当n充分大时，n次测量的平均值

应该和真值a“足够接近”。这一结果的数学结论就是大数定律。

定义1.1　设{Xn}是独立同分布的随机变量序列，如果对任意的ε>0，恒有

　　（1.3）　　

其中，，μ=EXn（不依赖于n），则称随机变量序列{Xn}服从大数定律。

经典大数定律有几种不同的形式。

1.契比晓夫大数定律

定理1.1　设随机变量X1，X2，…，Xn，…相互独立，且具有相同的数学期望和方差，E（Xk）=μ，var（Xk）=σ2（k=1，2，…，n，…）。则对任意给定的正数ε，都有

证　令

则　　

又因X1，X2，…，Xn，…独立，且var（Xk）=σ2。故

由契比晓夫不等式可得

即　　

又　　

因而　　

定理1.2（契比晓夫大数定律）　设随机变量X1，X2，…，Xn，…相互独立，每个变量分别存在数学期望E（X1），E（X2），…，E（Xn），…及方差var（X1），var（X2），…，var（Xn），…，并且这些方差是有界的，即存在某个正常数M，使得

var（Xi）<M　（i=1，2，…，n，…）

则对于任一正数ε，有

或　　

证明从略。

定理1.1是契比晓夫大数定律的特例。

契比晓夫大数定律表明，在所给条件下，当n充分大时，n个随机变量的算术平均值偏离其数学期望可能性很小。如果测定一物体的某一指标值a时，独立地重复测量得一系列实测值：X1，X2，…，Xn，求得实测值的平均值，根据契比晓夫大数定律知，当n足够大时，平均值与真值a之差的绝对值小于任意指定正数ε的概率可以充分地接近于1。所以实用上往往用某物体的某一指标的一系列实测值的算术平均值作为该指标的近似值。