§1 数学期望
随机变量是定义在样本空间上的函数,对应于不同的样本点,随机变量的值可能不同。有时,人们希望知道随机变量的大多数取值集中在哪里,能够粗略满足这一要求的是随机变量的平均值。例如,一射手进行打靶练习,规定射入区域e2(图3-1)得2分,射入区域e1得1分,脱靶,即射入区域e0,得0分。射手每次射击的得分数X是一个随机变量,设X的分布律为
P{X=k}=pk(k=0,1,2)
图3-1
现在射击X次,其中得k分的有ak次(k=0,1,2),a0+a1+a2=N。他射击N次得分总和为a0×0+a1×1+a2×2。于是每次射击的平均得分数为
这个数值是表示得分数X的大多数取值的集中位置。这里的ak/N是事件{X=k}的频率,当N很大时,ak/N接近于事件{X=k}的概率pk,由此引出随机变量数学期望或均值的概念。
一、离散型随机变量的数学期望
定义1.1 设离散型随机变量X的分布律为
P{X=xk}=pk (k=1,2,…)
若级数绝对收敛 ,则称级数的和为随机变量X的数学期望(expectation),也称为X的分布的数学期望,记为E(X),即
(1.1)
在不致引起误会时,可把E(X)简写成EX。
数学期望简称期望,又称为均值。
期望是随机变量取值的一个代表性位置,它表示随机变量的大多数取值都集中在期望周围。
下面推导几种重要随机变量的数学期望。
【例1】 设X~(0—1)分布,求EX。
解 X的分布律:P{X=k}=pk(1-p)1-k(k=0,1;0<p<1)
所以
【例2】 设X~B(n,p),求E(X)。
解 由于(k=0,1,2,…,n)
所以
【例3】 设X~P(λ),求E(X)。
解
可见泊松分布的参数λ就是X的数学期望。 >
【例4】 设随机变量X服从参数为p的几何分布,求EX。
解 X的分布律:P{X=k}=p(1-p)k-1 (k=1,2,3,…)
所以
二、连续型随机变量的数学期望
定义1.2 设连续型随机变量X的密度函数为f(x),如果积分绝对收敛,则称其值为X的数学期望,记作E(X),即
(1.2)
【例5】 设X服从[a,b]上的均匀分布,求E(X)。
解 X的概率密度函数为
它恰是区间[a,b]的中点。
【例6】 设X~N(μ,σ2),求E(X)。
解 X的分布密度为
令,则得
可见,正态分布的参数μ就是相应随机变量X的数学期望。
【例7】 有5个相互独立工作的电子装置,它们的寿命Xk(k=1,2,3,4,5)服从同一指数分布,其分布密度为
(1)若将这5个电子装置串联工作组成整机,求整机寿命N的数学期望;
(2)若将这5个电子装置并联工作组成整机,求整机寿命M的数学期望。
解 (1)为求整机寿命N的数学期望,应先求出其分布密度。为此,要求出N的分布函数。由于整机是串联的,那么
FN(z)=P{N≤z}=P{min{X1,X2,…,X5}≤z}
由第二章§4式(4.12)
又
所以
(2)由于整机是并联时,整机M的寿命应为
M=max{X1,X2,X3,X4,X5}
FM(z)=P{M≤z}=P{X1≤z,X2≤z,X3≤z,X4≤z,X5≤z}
=[P{X1≤z}]5(z>0)
由此可知
这就是说,5个电子装置并联联接工作的平均寿命是串联联接工作平均寿命的11.4倍。
【例8】 按规定,某车站每天8:00~9:00,9:00~10:00都恰有一辆客车到站,但到站的时刻是随机的,且两者到站的时间相互独立。其规律为
(1)一旅客8:00到车站,求他候车时间的数学期望;
(2)一旅客8:20到车站,求他候车时间的数学期望。
解 设旅客的候车时间为X(以分计)。
(1)X的分布律为
候车时间的数学期望为
(2)X的分布律为
在上表中,例如,设A为事件“第一班车在8:10到站”,设B为事件“第二班车在9:30到站”
则候车时间的数学期望为
需要指出的是,有的随机变量的数学期望就不存在,如以
为分布密度的随机变量X的数学期望就不存在,这是因为积分发散的缘故。
数学期望有一个力学解释:设质量为1的物质分布在Ox轴上,其线密度为f(x),由于
所以,数学期望E(X)表示质量中心的坐标,它是质量系统的集中位置。
三、随机变量函数的数学期望的计算公式
实际问题中也往往需要求随机变量的函数的数学期望。
定理1.1 设Y是随机变量X的函数:Y=g(X)(g是连续函数)。
(1)若X是离散型随机变量,它的分布律为pk=P{X=xk}(k=1,2,…),且绝对收敛,则有
(1.3)
(2)若X是连续型随机变量,它的分布密度为f(x),且绝对收敛,则有
(1.4)
定理的重要意义在于求E(Y)时,不必先求Y的分布而只需知道X的分布就可以了。定理的证明超出了本书的范围。
上述定理还可以推广到两个或两个以上随机变量的函数的情况。例如,设Z是随机变量X,Y的函数Z=g(X,Y)(g是连续函数),那么,Z也是一个随机变量。
(1)设(X,Y)为二维离散型随机变量,且P{X=xi,Y=yj}=pij(i,j=1,2,…),如果绝对收敛,则有
(1.5)
(2)设二维连续型随机变量(X,Y)的分布密度为f(x,y),如果
绝对收敛,则有
(1.6)
【例9】 设随机变量X的分布律为
求E(X),E(X2),E(3X-1)。
解 列出下表
显然 E(X)=-1×0.2+0×0.7+3×0.1=0.1
E(X2)=1×0.2+0×0.7+9×0.1=1.1
E(3X-1)=-4×(0.2)+(-1)×0.7+8×0.1=-0.7
【例10】 设随机变量的分布密度为
求。
解
【例11】 设(X,Y)的联合分布为
当Z=(X-Y)2时,求E(Z)。
解 先列出下表
【例12】 设(X,Y)的分布密度为
求E(X2+Y2)。
解 f(x,y)不等于0的区域为右图3-2划虚线的三角域,则
图3-2
四、数学期望的性质
下面介绍数学期望的几个重要性质(以下都假设数学期望存在)。
(1)设C是常数,则有E(C)=C。
(2)设X是一个随机变量,C是常数,则有
E(CX)=CE(X)
(3)设X、Y是两个随机变量,则有
E(X+Y)=E(X)+E(Y)
(4)设X,Y是相互独立的随机变量,则有
E(XY)=E(X)E(Y)
性质(3)(4)可以推广到有限个相互独立的随机变量的情况。
证 仅对连续型随机变量情况,证明(3)和(4) :设二维随机变量(X,Y)的联合概率密度函数为f(x,y),其边缘密度为fX(x),fY(y),由本节式(1.6)可知
又若X和Y相互独立,此时
f(x,y)=fX(x)fY(y)
则
【例13】 两台同样自动记录仪,每台无故障工作的时间服从参数为5的指数分布,首先开动其中一台,当其发生故障时停用而另一台自行开动,试求两台记录仪无故障工作的总时间T的数学期望。
解 设第一、二台无故障工作的时间分别为T1,T2,总的无故障工作时间为T,则T=T1+T2,且E(T)=E(T1+T2)=E(T1)+E(T2)。我们知道
则
【例14】 一民航送客车载有20位旅客自机场开出,旅客有10个车站可以下车。如到达一个车站没有旅客下车就不停车。以X表示停车的次数,求E(X)(设每位旅客在各个车站下车是等可能的,并设各旅客是否下车相互独立)。
解 这里随机变量X较复杂。引入随机变量
则有 X=X1+X2+…+X10
按题意,任一旅客在第i站不下车的概率为9/10,因此20位旅客都不在第i站下车的概率为,在第i站有人下车的概率为,也就是
所以
则