概率论与数理统计(第二版)
上QQ阅读APP看本书,新人免费读10天
设备和账号都新为新人

§1 离散型随机变量及其分布

一、离散型随机变量

n次贝努利随机试验序列中,将事件A所发生的累计次数记作X,那么X的取值依赖于n次贝努利随机试验序列的结果ω(基本事件)。需要指出的是,这里所谓的“基本事件ω”是指,完整地独立重复做完n次贝努利随机试验以后得到的结果,所以,Xω的函数:X=Xω),在不至于混淆的情况下,简记作X

n次贝努利随机试验序列的样本空间:Ω={ω:0,1,2,3,…,n},X=Xω)的取值可以定义为:0,1,2,3,…,n。像这种依赖于随机试验的结果取不同值的变量,称之为随机变量。

随机变量是概率论中最重要的基本概念之一,其描述性定义可作如下表述。

定义1.1 设随机试验E的样本空间是Ω,如果对每一个ωΩ,都有唯一确定的实数Xω)与之对应,这种定义在样本空间上的单值实值函数X=Xω),称为随机变量(random variable)。

随机变量的严格数学定义是测度论中的可测函数,因此,随机变量与微积分理论中的函数有本质的区别。在微积分理论中,依赖于自变量的函数的取值是百分之百确定的;概率论中的随机变量,是定义在样本空间上的函数,其取值依赖于随机试验的结果,由于随机试验结果的发生具有一定的概率,所以,随机变量的取值也具有一定的概率。

定义1.2 如果随机变量X的全部可能取值的个数,或者有限,或者可列无穷多个,则随机变量X称为离散型随机变量(discrete random variable)。

【例1】 n次贝努利随机试验序列中,随机变量X表示事件A发生的累计次数,X全部可能取值:0,1,2,3,…,n。这里的随机变量X就是取有限个值的离散型随机变量。

【例2】 设随机变量X表示,在某段时间内,服务系统的服务台接到要求服务的次数,X全部可能取值:0,1,2,3,…,n,…。这种随机变量就是取可列无穷多个值的离散型随机变量。

实际上,许多随机试验的结果本身就是一个数,例如射手打靶命中的环数;开车出行时遇到红灯的次数。而也有一些随机试验的结果并不是数,例如产品检验,其结果为“合格品”与“废品”,但可以为每一个结果赋予一个数值,例如令X=1表示结果为“合格品”,X=0表示结果为“废品”。所以,随机变量的不同取值可以表示随机试验的不同结果(即基本事件),由基本事件构成的一般随机事件就可以用随机变量的某种取值形式来表示。

二、离散型随机变量的概率分布律

设随机变量X表示n次贝努利随机试验序列中事件A发生的累计次数,那么随机事件{X=k}就表示n次贝努利随机试验序列中,事件A恰好发生了k次。第一章第三节的定理3.5(二项概率公式)给出了随机事件{X=k}的概率

   (1.1)   

其中 k=0,1,…,n;0<p<1, q=1-p

因为式(1.1)中的表达式是(p+qn的二项展开式中的一项,所以n次贝努利随机试验序列也称为二项随机试验序列,相应的随机变量称为二项随机变量(binomial random variable)。

定义1.3 表示离散型随机变量X的所有不同取值xii=1,2,…,n,…)与相应概率的关系式

P{X=xi}=pii=1,2,…,n,…)  (1.2)

称为离散型随机变量的概率分布律

式(1.1)是二项随机变量的概率分布律(probability distribution),简称为二项分布(binomial distribution),二项分布是最重要的分布律之一,可以作为描述很多随机试验的概率模型。

【例3】 某射手命中目标的概率为P,假定在同样条件下(即各次射击互不影响,相互独立)重复射击了n次,随机变量X表示击中目标的次数,那么X服从二项分布。

【例4】 设生产某种产品的生产线的废品率为P,检验该生产线的100件产品,令随机变量X表示其中废品的个数,那么X服从二项分布。

【例5】 一个120人组成的旅游团进入商店购物,假定每个成员的购物概率大致相等,而且购物行为相互独立,令随机变量X表示旅游团离开商店时已经购物的人数,那么X服从二项分布。

上述三个例子中的随机试验内容是完全不同的,但是,可以用具有相同分布律的随机变量来描述人们感兴趣的随机事件,这就是随机变量在随机现象的研究中所具有的独特作用。

由概率定义可知,离散型随机变量的分布律应满足两条性质。

(1)0≤pi≤1 (i=1,2,…,n,…);

(2)

凡满足上述两条性质的关系式或表格均可作为离散型随机变量的分布律。

实际上,离散型随机变量是给每一个基本事件对应一个实数,将基本事件发生的概率作为离散随机变量取得相应值的概率,从而构成了离散型随机变量的分布律。

【例6】 设

为某个离散型随机变量X的分布律,求

(1)常数α

(2)P{-2≤X<0}。

 由分布律的性质(2)知

α+3/8+1/8+α=1

从而解得  α=1/4

故  P{-2≤X<0}=α+3/8=5/8

三、常用离散型随机变量及其分布律

1.(0—1)分布(又称两点分布)

若随机变量的分布律为

P{X=k}=pk(1-p1-k (k=0,1;0<p<1)

则称X服从(0—1)分布。

贝努利试验是产生(0—1)分布的现实源泉,所以,服从(0—1)分布的随机变量也称为贝努利随机变量或二值随机变量。(0—1)分布是用来描述只具有两种结果的随机试验,如“掷硬币”、“只考虑成品与废品的产品检验”、“通讯线路的畅通与间断”等。

2.二项分布

若随机变量X的分布律可表作式(1.1),即

其中k=0,1,…,n;0<p<1, q=1-p

则称X服从参数为np的二项分布,记作XBnp)。

如前所述,二项分布源自n次贝努利试验序列,它在理论与实践中都有着广泛的应用。由于p+q=1,所以不难验证,二项分布满足分布律的两条性质。

当二项分布的参数n=1时,二项分布就成为(0—1)分布。

3.泊松(Poisson)分布

若随机变量X的分布律为

P{X=k}=e-λλk/k! (k=0,1,2,…)(λ>0)

则称X服从参数为λ泊松分布,记为Pλ)。

P{X=k}满足分布律的两条性质(留给读者自证)。

泊松分布与二项分布有着密切的关系。

定理1.1(泊松定理) 设随机变量Xnn=1,2,…)服从二项分布,其分布律为

pnn有关,且npn=λ>0,λ为常数,n=1,2,…,则有

证明 由pn=λ/n可知

对于任意固定的kk=0,1,…,n

故有   

 定理中的条件“npn=λ>0,λ为常数”的一般化情况“λ为常数”,证明过程略有不同。一般化的条件说明,泊松定理要求:n很大而pn(0<pn<1)很小。

泊松定理表明,既可以用二项分布来逼近泊松分布,也可以用泊松分布来近似二项分布。若给定泊松分布Pλ),可以用参数n比较大的二项分布来逼近;若给定参数n比较大的二项分布Bnp),可以用泊松分布Pnp)来近似,即

成立。其中λ=np

前边所介绍的(0—1)分布、二项分布、泊松分布是三种重要的离散型随机变量的分布。它们都有广泛的应用。下边举例说明。

【例7】 某射手独立射击400次。设每次射击的命中率为0.02,试求命中次数大于或等于2的概率。

 将每次射击看成是一次试验,设击中的次数为X,则XB(400,0.02)。于是所求的概率为

直接计算上式显然是很麻烦的,下面用泊松分布作近似计算。

λ=np=400×0.02=8

于是   

因此  P{X≥2}≈1-e-8-8e-8=1-9e-8=0.997

这个概率很接近于1。这一结果告诉人们:尽管在每次试验中,事件A发生的概率很小,但是在大量、重复的独立试验中,事件A的发生几乎是肯定的。因此决不能轻视小概率事件!

【例8】 为了保证设备正常工作,需要配备适量的维修工人(维修工配备多了是个浪费,配备少了又要影响生产),现有同类设备300台,各台设备工作是相互独立的,每台设备发生故障的概率都是0.01,每台设备的故障只需一人来处理。问至少配备多少维修工人,才能保证当设备发生故障但不能及时维修的概率小于0.01?

 设需要配备N名维修工人,记同一时刻发生故障的设备台数为X,那么,XB(300,0.01)。要保证当设备发生故障但不能及时维修的概率小于0.01,则N应满足

P{X>N}≤0.01

令λ=np=300×0.01=3,由泊松定理知

查附表2知,N至少应该是8。因此,要达到题中要求需配备8名维修工人。

下边再举两个常用的离散型分布的例子。

【例9】 进行重复独立试验,每次试验事件A发生的概率为p(0<p<1),设X表示事件A首次发生时的试验次数,则称X服从几何分布。其分布律为

P{X=k}=p(1-pk-1 (k=1,2,…,n,…)

【例10】 一个口袋里装有a个红球、b个白球,从中任取m个球(1≤ma+b),设X表示从中取出的红球个数,则称X服从超几何分布。其分布律为

四、随机变量的分布函数

定义1.4 对任意实数x,随机变量X取值不超过x的累积概率P{Xx}是实数x的函数,称为随机变量X的累积分布函数(cumulative distribution function)或累积概率,简称X分布函数,记作FXx)或简记作Fx),即

Fx)=P{Xx}  (1.3)

Fx)是随机变量X分布函数,对任意实数x1x2x1<x2),有

     P{x1<Xx2}=P{Xx2}-P{Xx1}

          =Fx2)-Fx1

即分布函数Fx)可以表示随机变量X落在任一区间(x1x2]上的概率,所以分布函数可以完整地描述随机变量概率分布的规律性。

随机变量的分布函数是定义在实数轴上,以闭区间[0,1]为值域的普通函数(即微积分理论中定义的函数)。所以,有了分布函数,就可以用微积分理论来研究随机变量。

分布函数具有下列性质:

(1)0≤Fx)≤1 (-∞<x<+∞);

(2)若x1<x2,则Fx1)≤Fx2),即任一分布函数都是单调不减的;

(3)

(4)右连续,即

反之,凡具有上述性质的实函数都是某个随机变量的分布函数。

对于具有式(1.2)分布律的离散型随机变量X,其分布函数

   (1.4)   

其中和式是对所有满足“xix”的P{X=xi}=pi求和。

【例11】 设X服从(0—1)分布。求

(1)X的分布函数;

(2)P{X≤1/2};

(3)P{1<X≤3/2}。

 X的分布律为

P{X=k}=pk(1-p1-k (k=0,1)

x<0时,  {Xx}=ф

故  Fx)=P{Xx}=0

当0≤x<1时,  {Xx}={X=0}

所以  P{Xx}=1-p

此时  Fx)=1-p

x≥1时,  {Xx}={X=0}∪{X=1}

因而  Fx)=P{Xx}=P{X=0}+P{X=1}=1

总之

(1)

(2)

(3)