*§4 条件数学期望
现将两个球随机地投入编号为1,2,3,4的4个盒子中,Xi表示第i个盒子内球的个数(i=1,2)。试求,在第2个盒子中有一个球的条件下第1个盒子内球的个数的平均值。
首先,可以求出(X1,X2)的联合分布及其关于X2的边缘分布,见下表
再者,求出在X2=1条件下关于X1的条件分布
这样,可以求出在X2=1条件下,关于X1的平均值,记为E(X1|X2=1),即
一般地,设(X,Y)是二维离散型随机变量,P{X=xk|Y=y}是在Y=y条件下随机变量X的条件分布律,X在条件分布律P{X=xk|Y=y}下的数学期望,称为随机变量X在条件Y=y下的期望,记作E(X|Y=y),即
同样,对二维连续型随机变量(X,Y),若fX|Y(x|y)是在Y=y条件下随机变量X的条件概率密度,X在条件密度fX|Y(x|y)下的数学期望,称为随机变量X在条件Y=y下的期望,记作E(X|y),即
显然,无论是离散型还是连续型随机变量,E(X|Y=y)是Y的函数,记作ψ(Y),它是随机变量Y的函数。所以,ψ(Y)也是随机变量。
定义4.1 设(X,Y)是二维离散型随机变量,P{X=xk|Y=y}(k=1,2,…)是在Y=y条件下随机变量X的条件分布律,若级数绝对收敛,则称随机变量ψ(Y)是X关于Y的条件期望,记作E(X|Y),即
(4.1)
定义4.1' 设(X,Y)是二维连续型随机变量,fX|Y(x|y)是在Y=y条件下随机变量X的条件概率密度,若积分绝对收敛,则称随机变量ψ(Y)是X关于Y的条件期望,记作E(X|Y),即
(4.2)
注 当Y=y时,ψ(y)是X在Y=y条件下的条件期望值,是X关于Y的条件期望这一随机变量ψ(Y)的取值。
同样可以定义Y关于X的条件期望φ(X),记作E(Y|X),其中φ(x)=E(Y|X=x)。
【例1】 设X~P(λ1),Y~P(λ2),且X与Y相互独立,求在X+Y=k(k为非负整数)下X的条件数学期望。
解 因为
【例2】 设,求E(Y|X)。
解 由第二章§3例9知,在X=x下Y的条件密度函数为
所以
从而,这是X的线性函数,故E(Y|X)是随机变量,类似可得
条件数学期望有下列性质:
设X,Y,Z均为同一样本空间上的随机变量,g(x)为连续函数,且E(X),E(Y),E(Z)与E[g(Y)X]均存在,则
(1)当X与Y相互独立时,E(X|Y)=E(X);
(2)E[E(X|Y)]=E(X);
(3)E[g(Y)·X|Y]=g(Y)·E(X|Y);
(4)E[g(Y)·X]=E[g(Y)·E(X|Y)];
(5)E(C|Y)=C,C为常数;
(6)E[g(Y)|Y]=g(Y);
(7)E[aX+bY|Z]=aE(X|Z)+bE(Y|Z);
(8)E[X-E(X|Y)]2≤E[X-g(Y)]2。
证 (1)仅就(X,Y)为连续型时给以证明。
由于X与Y相互独立,故,所以对任意实数y
(2)当(X,Y)为连续型随机变量时
即 (4.3)
当(X,Y)为离散型随机变量且Y只取有限个值yj(j=1,2,…,n)时
如果记事件{Y=yj}为Aj,则
(4.4)
称式(4.3)、式(4.4)为全数学期望公式(类似于全概率公式)。
(3)只需证,对任意固定的y,有
E[g(y)·X|y]=g(y)E(X|y)
成立即可。仅就(X,Y)为连续型随机变量时给以证明。事实上,由定义有
(4)由(2)和(3)得
E[g(Y)·X]=E{E[g(Y)·X|Y]}=E[g(Y)E(X|Y)]
(5)由(1)即得。
(6)由(3)和(5)即得。
(7)由定义直接可得。
(8)即要证,对任意固定的y,当g(y)=E(X|y)时,E[X-g(y)]2为最小。今就连续型的情形证明如下
由第三章习题第10题知,当g(y)=E(X|Y=y)时,积分fX|Y(x|y)dx达到最小,因而E[x-g(Y)]2为最小。
【例3】 (矿工脱险问题)一矿工在有三扇门的矿井中迷了路,第一扇门通到一坑道走3小时可使他到达安全地点;第二扇门通向使他走5小时后又回到原地点的坑道;第三扇门通向使他走了7小时后又回到原地点的坑道。如果他在任何时刻都等可能地选定其中一扇门。试问他到达安全地点平均要花多少时间?
解 设X表示他到达安全地点所需要的时数,Y表示他最初选定门的号数,则
由全数学期望公式,所求平均时数为
而E(X|Y=1)=3,E(X|Y=2)=5+E(X),E(X|Y=3)=7+E(X),所以
解之得 E(X)=15(小时)