§2 连续型随机变量及其分布
一、连续型随机变量
在实际问题中,存在着与离散型随机变量取值形式不同的另外一类随机变量,它们可以在整个实数轴,或实数轴的区间上取值。因此,这类随机变量的概率分布规律,就不可能用离散型随机变量的概率分布律来描述。
定义2.1 设F(x)是随机变量X的分布函数,若对任意的实数x,存在f(x)≥0,使
(2.1)
则称X为连续型随机变量,称f(x)为X的密度函数(也称为分布密度或概率密度),并称X的分布为连续型分布。
密度函数具有下列性质:
(1)f(x)≥0 (-∞<x<+∞);
(2);
(3);
(4)若f(x)在x处连续,则
F'(x)=f(x)
由性质(2)知,介于曲线y=f(x)与x轴之间的面积为1。如图2-1所示。
图2-1
注 凡满足性质(1)、(2)的函数都可作为某个连续型随机变量的密度函数。
(5)连续型随机变量X取任一指定实数值a的概率都等于0。即
P{X=a}=0
证明 任给Δx>0,有
0≤P{X=a}≤P{a-Δx<X≤a}=F(a)-F(a-Δx)
由F(x)的连续性可知
故 0≤P{X=a}≤0
因而 P{X=a}=0
由此可知,对于连续型随机变量X,求其落在某一区间的概率时,无论区间是开的、闭的或半开半闭的,其概率值均相等。即
(6)若f(x)在x处连续,连续型随机变量X在x附近取值的概率,利用微积分中的微元法可表作
P(x<X≤x+dx)≈f(x)dx
【例1】 若f(x)=Ae-|x|(-∞<x<+∞)为某个连续型随机变量X的密度函数,求
(1)常数A;
(2)X的分布函数;
(3)。
解 (1)由,有,得。
(2)当x<0时
当x≥0时
总之
(3)
二、几种常用的连续型随机变量的分布
1.均匀分布
若X的密度函数为
(2.2)
则称X服从区间[a,b]上的均匀分布(uniform distribution),记作X~U[a,b]。X的分布函数为
(2.3)
均匀分布的密度函数f(x)与分布函数图形如图2-2所示。
图2-2
对于[a,b]的任一子区间[c,d]有
这说明X落在[a,b]中的任一子区间的概率与该子区间的长度成正比,而与该子区间在[a,b]中的具体位置无关,即X在[a,b]中的取值具有等可能性。所以,均匀分布是连续情形下的等可能概率模型。
【例2】 公共汽车每10分钟一趟,每位乘客在任意时刻到达汽车站的可能性相同,求乘客候车时间X的密度函数和分布函数。
解 由已知条件可知,乘客候车时间X∈[0,10]。
当x<0时,P(X≤x)=P(ф)=0
当0≤x<10时,P(X≤x)=P(0≤X≤x),由几何概型知
当x≥10时,P(X≤x)=P(Ω)=1
所以X的分布函数
X的密度函数
注1 实际上,由于乘客到达汽车站的时刻具有等可能性,而公共汽车每10分钟一趟,所以,乘客的候车时间X服从区间[0,10]上的均匀分布。
注2 在0和10处分别取右、左极限。
【例3】 设X服从区间[1,6]上的均匀分布,求方程x2+Xx+1=0有实根的概率。
解 由已知条件可得X的密度函数为
x2+Xx+1=0有实根⇔Δ=X2-4≥0⇔|X|≥2⇔X≥2或X≤-2
即方程x2+Xx+1=0有实根的概率为4/5。
2.指数分布
若X的密度函数为
(2.4)
则称X服从参数为λ的指数分布,记作X~E(λ)。其分布函数为
(2.5)
指数分布常用于描述设备或元器件的寿命,需要指出的是,由于指数分布具有无记忆性,而实际中的元件寿命绝不会是无记忆的,所以,指数分布只能粗略近似地描述寿命问题。尽管如此,指数分布还是为寿命问题的讨论提供了一个简单而完整的数学模型,因此它是可靠性领域中最基本、最常用的分布。
【例4】 一种电子元件的失效时间T服从的指数分布,问该电子元件至少能工作5小时的概率。
解 失效时间T的分布密度函数
若T≥5,元件至少能工作5小时。
所以
3.正态分布
若X的密度函数为
(2.6)
则称X服从参数为μ,σ的正态分布。记为X~N(μ,σ2)。当μ=0,σ=1时,则称X服从标准正态分布,记为N(0,1)。
正态分布也称为高斯(Gauss)分布、误差分布。这是因为正态分布是高斯在研究误差分布时所得到的。测量误差服从正态分布。在数理统计中,正态分布也有极其广泛的应用。下边,我们对正态分布作进一步介绍。
正态分布的密度函数f(x)满足密度函数的两条性质:
性质(1)f(x)≥0显然成立。性质(2)证明如下
令,则上式变为
因为,所以。
y=f(x)的图形关于直线x=μ对称,且在x=μ时,f(x)达到最大值;在(-∞,μ)内y=f(x)单调增加,在(μ,+∞)内y=f(x)单调减少;在区间(μ-σ,μ+σ)内,y=f(x)的图形是凸的,在(-∞,μ-σ)与(μ+σ,+∞)内,曲线y=f(x)都是凹的;μ-σ与μ+σ是曲线y=f(x)的两个拐点。对于标准正态分布,曲线y=f(x)关于y轴对称。
如果固定μ,改变σ,则当σ较大时,y=f(x)的图形矮、胖;当σ较小时,y=f(x)的图形高、瘦。如果σ固定,μ改变,y=f(x)的图沿x轴平行移动,而不改变形状,如图2-3所示。
图2-3
在概率论的发展史上,人们通过对大量事实的研究发现,如果一个随机变量的取值受到大量彼此独立而且作用微小的随机因素的共同作用,这些随机因素中没有一种因素起显著作用,那么,这个随机变量就服从正态分布。例如测量误差,各种质量指标(如产品的厚度,强度等)的测量值都可认为是服从正态分布。这一结论将在第四章的中心极限定理中给予理论上的解释。
有关参数为μ,σ的正态分布N(μ,σ2)的计算,可以归结为标准正态分布N(0,1)的计算。
定理2.1 若随机变量X~N(μ,σ2),则服从标准正态分布N(0,1)。
证明 计算的分布函数
令,则
即X*的密度函数为,故X*~N(0,1)。
人们习惯将标准正态随机变量的密度函数与分布函数分别记作φ(x)和Φ(x),即
图形如图2-4所示。
图2-4
对于Φ(x),鉴于被积函数为偶函数,不难推出如下结果:
为了便于计算,构造了函数Φ(x)的数值表,由于Φ(4)≥0.9999,所以数值表中自变量的取值范围是(0,3.9),Φ(x)的数值表见本书附表。
【例5】 设X~N(0,1),计算(1)P{X<-1.23};(2)P{X>1.23};
(3)P{|X|<1.23};(4)P{|X|>1.23}。
解 (1)P{X<-1.23}=1-Φ(1.23)=1-0.8907=0.1093
(2)P{X>1.23}=1-Φ(1.23)=0.1093
【例6】 设X~N(-1,4),计算(1)P{X≤1.23};(2)P{X<-1.23};(3)P{|X|<1.23}。
解 因为X~N(-1,4),所以。
(1)
查Φ(x)数值表可得Φ(1.11)=0.8665,Φ(1.12)=0.8686利用线性插值
【例7】 设X~N(μ,σ2),求P{|X-μ|≤kσ}的值(k=1,2,3)。
解
查标准正态分布表得:
当k=1时,P{|X-μ|≤kσ}=0.6826;
当k=2时,P{|X-μ|≤kσ}=0.9544;
当k=3时,P{|X-μ|≤kσ}=0.9974。
由上述结果可知,当X~N(μ,σ2)时,X落在区间[μ-3σ,μ+3σ]上的概率为0.9974,几乎是必然的,而X落在该区间外的概率为0.0026,几乎是不可能的。正因为如此,工程技术中常常把X落在[μ-3σ,μ+3σ]外的情况忽略不计。这就是数据处理中常用的3σ准则。
【例8】 设X~N(160,σ2),若X落在区间(120,200)之间的概率不小于0.8,则允许σ最大为多少?
解
即 。查附表1得Φ(1.28)=0.9
所以 σ≤31.25
要满足题中条件,允许σ最大为31.25。
【例9】 轴的长度X~N(10,0.01),如果轴的长度在(10-0.2,10+0.2)范围内算合格。今有四根轴,求(1)恰有三根轴长度合格的概率;(2)至少有三根轴长度合格的概率。
解 轴的长度X合格,即X应满足
10-0.2<X<10+0.2
查附表1得
P{10-0.2<X<10+0.2}=0.9544
(1)恰有三根轴长度合格的概率为
(2)至少有三根轴长度合格的概率为
【例10】 若X~N(2,σ2),且P{2<X≤4}=0.3,求P{X<0}。
解 由于参数为μ,σ2的正态分布的密度函数关于X=μ对称,则对任意实数x>0,有
P{μ<X≤μ+x}=P{μ-x≤X<μ}
据此