§2 连续型随机变量及其分布_概率论与数理统计（第二版）-QQ阅读男生都市网

上QQ阅读APP看本书，新人免费读10天

设备和账号都新为新人

§2　连续型随机变量及其分布

一、连续型随机变量

在实际问题中，存在着与离散型随机变量取值形式不同的另外一类随机变量，它们可以在整个实数轴，或实数轴的区间上取值。因此，这类随机变量的概率分布规律，就不可能用离散型随机变量的概率分布律来描述。

定义2.1　设F（x）是随机变量X的分布函数，若对任意的实数x，存在f（x）≥0，使

　　（2.1）　　

则称X为连续型随机变量，称f（x）为X的密度函数（也称为分布密度或概率密度），并称X的分布为连续型分布。

密度函数具有下列性质：

（1）f（x）≥0　（-∞<x<+∞）；

（2）；

（3）；

（4）若f（x）在x处连续，则

F'（x）=f（x）

由性质（2）知，介于曲线y=f（x）与x轴之间的面积为1。如图2-1所示。

图2-1

注　凡满足性质（1）、（2）的函数都可作为某个连续型随机变量的密度函数。

（5）连续型随机变量X取任一指定实数值a的概率都等于0。即

P{X=a}=0

证明　任给Δx>0，有

0≤P{X=a}≤P{a-Δx<X≤a}=F（a）-F（a-Δx）

由F（x）的连续性可知　　

故　　0≤P{X=a}≤0

因而　　P{X=a}=0

由此可知，对于连续型随机变量X，求其落在某一区间的概率时，无论区间是开的、闭的或半开半闭的，其概率值均相等。即

（6）若f（x）在x处连续，连续型随机变量X在x附近取值的概率，利用微积分中的微元法可表作

P（x<X≤x+dx）≈f（x）dx

【例1】　若f（x）=Ae-｜x｜（-∞<x<+∞）为某个连续型随机变量X的密度函数，求

（1）常数A；

（2）X的分布函数；

（3）。

解　（1）由，有，得。

（2）当x<0时

当x≥0时

总之

（3）

二、几种常用的连续型随机变量的分布

1.均匀分布

若X的密度函数为

　　（2.2）　　

则称X服从区间［a，b］上的均匀分布（uniform distribution），记作X～U［a，b］。X的分布函数为

　　（2.3）　　

均匀分布的密度函数f（x）与分布函数图形如图2-2所示。

图2-2

对于［a，b］的任一子区间［c，d］有

这说明X落在［a，b］中的任一子区间的概率与该子区间的长度成正比，而与该子区间在［a，b］中的具体位置无关，即X在［a，b］中的取值具有等可能性。所以，均匀分布是连续情形下的等可能概率模型。

【例2】　公共汽车每10分钟一趟，每位乘客在任意时刻到达汽车站的可能性相同，求乘客候车时间X的密度函数和分布函数。

解　由已知条件可知，乘客候车时间X∈［0，10］。

当x<0时，P（X≤x）=P（ф）=0

当0≤x<10时，P（X≤x）=P（0≤X≤x），由几何概型知

当x≥10时，P（X≤x）=P（Ω）=1

所以X的分布函数

X的密度函数

注1　实际上，由于乘客到达汽车站的时刻具有等可能性，而公共汽车每10分钟一趟，所以，乘客的候车时间X服从区间［0，10］上的均匀分布。

注2　在0和10处分别取右、左极限。

【例3】　设X服从区间［1，6］上的均匀分布，求方程x2+Xx+1=0有实根的概率。

解　由已知条件可得X的密度函数为

x2+Xx+1=0有实根⇔Δ=X2-4≥0⇔｜X｜≥2⇔X≥2或X≤-2

即方程x2+Xx+1=0有实根的概率为4/5。

2.指数分布

若X的密度函数为

　　（2.4）　　

则称X服从参数为λ的指数分布，记作X～E（λ）。其分布函数为

　　（2.5）　　

指数分布常用于描述设备或元器件的寿命，需要指出的是，由于指数分布具有无记忆性，而实际中的元件寿命绝不会是无记忆的，所以，指数分布只能粗略近似地描述寿命问题。尽管如此，指数分布还是为寿命问题的讨论提供了一个简单而完整的数学模型，因此它是可靠性领域中最基本、最常用的分布。

【例4】　一种电子元件的失效时间T服从的指数分布，问该电子元件至少能工作5小时的概率。

解　失效时间T的分布密度函数

若T≥5，元件至少能工作5小时。

所以　　

3.正态分布

若X的密度函数为

　　（2.6）　　

则称X服从参数为μ，σ的正态分布。记为X～N（μ，σ2）。当μ=0，σ=1时，则称X服从标准正态分布，记为N（0，1）。

正态分布也称为高斯（Gauss）分布、误差分布。这是因为正态分布是高斯在研究误差分布时所得到的。测量误差服从正态分布。在数理统计中，正态分布也有极其广泛的应用。下边，我们对正态分布作进一步介绍。

正态分布的密度函数f（x）满足密度函数的两条性质：

性质（1）f（x）≥0显然成立。性质（2）证明如下

令，则上式变为

因为，所以。

y=f（x）的图形关于直线x=μ对称，且在x=μ时，f（x）达到最大值；在（-∞，μ）内y=f（x）单调增加，在（μ，+∞）内y=f（x）单调减少；在区间（μ-σ，μ+σ）内，y=f（x）的图形是凸的，在（-∞，μ-σ）与（μ+σ，+∞）内，曲线y=f（x）都是凹的；μ-σ与μ+σ是曲线y=f（x）的两个拐点。对于标准正态分布，曲线y=f（x）关于y轴对称。

如果固定μ，改变σ，则当σ较大时，y=f（x）的图形矮、胖；当σ较小时，y=f（x）的图形高、瘦。如果σ固定，μ改变，y=f（x）的图沿x轴平行移动，而不改变形状，如图2-3所示。

图2-3

在概率论的发展史上，人们通过对大量事实的研究发现，如果一个随机变量的取值受到大量彼此独立而且作用微小的随机因素的共同作用，这些随机因素中没有一种因素起显著作用，那么，这个随机变量就服从正态分布。例如测量误差，各种质量指标（如产品的厚度，强度等）的测量值都可认为是服从正态分布。这一结论将在第四章的中心极限定理中给予理论上的解释。

有关参数为μ，σ的正态分布N（μ，σ2）的计算，可以归结为标准正态分布N（0，1）的计算。

定理2.1　若随机变量X～N（μ，σ2），则服从标准正态分布N（0，1）。