2016年中山大学432统计学[专业硕士]考研真题及详解
一、(每小题3分,共60分)单项选择题
1.随机事件A,B,C中恰有两个事件发生的复合事件为( )。
A.(A∩B)∪(A∩C)∪(B∩C)
B.
C.(A∩B∩C(_))∪(A∩B(_)∩C)∪(A(_)∩B∩C)
D.(A∩B(_)∩C(_))∪(A(_)∩B(_)∩C)∪(A(_)∩B∩C(_))
【答案】C
【解析】A,B,C恰有两个事件发生可以理解为:AB发生C不发生或AC发生B不发生或BC发生A不发生,因此选C项。
2.假设随机事件A,B都既不是不可能事件也不是必然事件,并且A≠B,A(_)≠B。包含随机事件A,B的最小的σ域中元素的个数为( )。
A.4
B.8
C.16
D.32
【答案】B
【解析】若一个集合中元素的个数为n,则最小σ域的元素个数为2n+1。此题包含φ,A,B,A(_),B(_),A∪B,A∩B,Ω总共八个。
3.以下哪条是概率的公理化定义中要求的?( )
A.有限可加性
B.可列可加性
C.上连续性
D.下连续性
【答案】B
【解析】概率的公理化定义为非负性、规范性和可列可加性。
4.从(0,1)中独立随机地取两个数b,c,则方程x2+bx+c=0有实根的概率为( )。
A.1/24
B.1/12
C.1/6
D.1/4
【答案】B
【解析】方程有实数解的充要条件是b2-4c≥0。由几何概型可得,b2-4c≥0成立的概率为函数y=1/4x2与单位正方形[0,1]×[0,1]的相交的下半部分面积,求得概率为1/12。
5.下面哪个选项不是随机事件A,B(0<P(A),P(B)<1)相互独立的充要条件( )。
A.P(A|B)=P(A|B(_))
B.P(A|B)+P(A(_)|B(_))=1
C.P(A∩B(_))=P(A)P(B(_))
D.P(A|B)+P(A|B(_))=1
【答案】D
【解析】很容易知道A、C是随机事件A,B相互独立的充要条件。B项由P(A|B)+P(A(_)|B(_))=P(A|B)+1-P(A|B(_))=1知,P(A|B)=(A|B(_)),因此B项是A,B相互独立的充要条件。同理,D项由P(A|B)+P(A|B(_))=P(A|B)+1-P(A(_)|B(_))=1知,P(A|B)=(A(_)|B(_)),不能作为A与B相互独立的充要条件。
6.己知P(A)=0.4,P(B)=0.25,P(A-B)=0.25,则P(A∪B)=( )。
A.0.4
B.0.5
C.0.6
D.0.65
【答案】B
【解析】由P(A-B)=P(A)-P(B),知P(AB)=P(A)-P(A-B)=0.4-0.25=0.15。而P(A∪B)=P(A)+P(B)-P(AB)=0.4+0.25-0.15=0.5。
7.到达银行的顾客分为两类,一类是办理现金业务,一类是办理非现金业务。假设在特定时间内这两类顾客的到达人数服从泊松分布,并相互独立。己知平均每个小时5个人办理现金业务,2个人办理非现金业务,则在一个小时内没有人到达银行的概率为( )。
A.e-2
B.e-5
C.e-7
D.e-14
【答案】C
【解析】由泊松分布的概率公式知一小时内没有人办理现金业务的概率为
同理一个小时内没有人办理非现金业务的概率为e-2,由于办理现金业务和非现金业务两个事件相互独立,因此一个小时内没有人到达银行的概率为e-5·e-2=e-7,因此选C项。
8.选择题有四个答案,只有一个是正确的。懂的学生能够准确回答,不懂的学生从四个答案中随机选择。假定一个学生懂与不懂的概率都是0.5,则答对的学生对该题不懂的概率为( )。
A.0.1
B.0.2
C.0.4
D.0.5
【答案】A
【解析】设事件A表示答对该题,事件B表示懂该题,则答对该题的学生不懂该题的概率为P(B(_)|A),根据条件概率公式:
9.设X~B(100,0.2),设Φ(x)为标准正态分布的累积分布函数,则X>28的概率大约是( )。
A.1-Φ(2)
B.1-Φ(1)
C.Φ(2)
D.2Φ(2)-1
【答案】A
【解析】根据二项分布的正态近似可知
因此
因此选A项。
10.设(X,Y)服从三角形区域D={(x,y):0<x<y<1}上的均匀分布,则( )。
A.Y∣X服从区间(0,1)上的均匀分布
B.Y服从区间(0,1)上的均匀分布
C.Y∣X服从区间(X,1)上的均匀分布
D.Y服从区间(X,1)上的均匀分布
【答案】C
【解析】
因此选C项。
11.设X1,…,X10来自正态分布N(μ,σ2)的样本,X(_)=(X1+…+X10)/10,若Y=aX(_)+b~N(0,1),则( )。
A.a=0,b=1
B.,
C.a=10/σ2,b=-10μ/σ2
D.a=1/σ,b=-μ
【答案】B
【解析】由于X来自正态总体,因此
因此
故
解得后得到答案B项。
12.若X~N(0,1),Y~χ2(n),则的分布是( )。
A.t(n)
B.N(0,1)
C.t(n-1)
D.不能确定
【答案】D
【解析】由于不知道X,Y是否相互独立,因此不能确定t的分布。
13.设Xi~N(i-1,i),i=1,2,3,且X1,X2,X3之间相互独立。令X(_)=(X1+X2+X3)/3,
则( )。
A.
B.
C.
D.
【答案】C
【解析】由X1~N(0,1),,得到
由t分布定义得C正确。
14.设X1,…,Xn为来自正态分布N(0,σ2)的简单随机样本,则σ2的最大似然估计为( )。
A.
B.
C.
D.
【答案】A
【解析】Xi的密度函数为
似然函数为
对似然函数取对数
当
可以求得σ2的最大似然估计为,因此本题选A项。
15.设X1,…,X25为来自均匀分布U(θ-1,θ+1)的简单随机样本,其顺序统计量记为X(1),X(2),…,X(25),则下列统计量是θ的充分统计量的是( )。
A.X(1)
B.X(25)
C.(X(1),X(25))
D.X(13)
【答案】C
【解析】(X1,…,X25)的联合密度函数为
根据应在分解定理,可知θ的充分统计量为(X(1),X(25)),因此答案选C项。
16.X1,…,Xn为来自正态分布N(μ,1)的简单随机样本。记Zα为标准正态分布100α%分位数,则由此样本所构造的置信水平分别为95%与90%的双侧置信区间长度之比为( )。
A.2×Z0.975/Z0.95
B.Z0.975/Z0.95
C.2×Z0.95/Z0.90
D.Z0.95/Z0.90
【答案】B
【解析】总体均值μ区间估计的枢轴量为
由
可知置信区间长度为
于是95%与90%双侧置信区间长度之比为Z0.975/Z0.95,因此答案选B项。
17.X1,…,Xn为来自正态分布N(μ,1)的简单随机样本。令X(_)为其样本均值,若(X(_)-Cα,X(_)+Cα)为μ的1-α水平的置信区间,其中0<α<1,Cα>0为常数。若从总体N(μ,1)中新增一独立样品Xn+1,则Xn+1落在此置信区间的概率( )。
A.等于1-α
B.小于1-α
C.大于1-α
D.与1-α的大小关系不能确定
【答案】D
【解析】注意理解置信水平1-α的概念,它表示样本置信区间能够包含参数的比例,而不是某个样本落在置信区间的概率,因此本题答案为D项。
18.X1,X2,X3为来自正态分布N(0,σ2)的简单随机样本。记
χα2(r)为自由度为r的χ2分布的100α%分位数,则下面哪个不是σ2的95%的置信区间( )。
A.
B.
C.
D.
【答案】D
【解析】A项,Q1/σ2~χ2(3),因此A项正确;B项,
于是
故B项正确;由于
所以是σ2的95%的置信区间,C项正确,D项是σ2的5%的置信区间,错误。
19.在单因素方差中,Xk1,Xk2,…,Xkn~N(μk,σ2),k=1,2,3,且X11,…,X1n,X21,…,X2n,X31,…,X3n之间相互独立,令
若σ2=1,则( )。
A.
B.
C.
D.
【答案】D
【解析】由方差分析的性质知,SSE/σ2~χ2(3n-3)。根据SSE的计算公式,知本题应该选D项。
20.在简单线性回归中,以下关于回归系数最小二乘估计叙述错误的是( )。
A.求解最小二乘估计并不需要误差项服从正态分布
B.最小二乘估计是无偏估计
C.最小二乘估计是最优线性无偏估计(BLUE)
D.最小二乘估计是最小方差无偏估计(MVUE)
【答案】D
【解析】最小二乘估计不是所有估计中方差最小的,而是所有线性估计中方差最小的。
二、(共24分)设二维随机向量(X,Y)有密度
(1)(8分)判断X和Y是否相互独立。
(2)(8分)求在Y=0.5的条件下随机变量X的条件密度。
(3)(8分)求Z=X+Y的密度函数。
解:(1)
fX(x)fY(y)=1/4
因此X,Y不独立。
(2)
当Y=0.5时
(3)FZ(z)=P(X+Y≤z)=P(Y≤-X+z)
当Z≤-2,Fz(z)=0;
当-2<Z≤0时
当0<Z≤2时
当Z>2时,Fz(z)=1
因此Z的密度函数为
三、(共22分)设总体X的密度函数f(x)=2θ-2x,(0<x<θ),X1,…,Xn(n>3)为其简单随机样本。
(1)(6分)求θ的最大似然估计量θ(∧)1;
(2)(6分)求θ的矩法估计量θ(∧)2;
(3)(10分)据MSE(mean squared error)准则,请计算比较θ(∧)1与θ(∧)2的优劣。
解:(1)似然函数为
取对数
因此该似然函数为减函数,当似然函数最大时,θ应该最小。故最大似然估计θ(∧)1=X(n)。
(2)
因此。
(3)由于
所以X(n)的概率密度函数为
所以
因此
由于n>3,所以-2n2+5n-1<0,即
所以MSE(θ(∧)2)>MSE(θ(∧)1),即θ(∧)1是更优估计。
四、(22分)设X1,…,Xn(n≥3)为来自伯努利分布B(1,p)的样本,己知T=X1+…+Xn为参数p的充分统计量。
(1)(8分)求p2的最大似然估计,并说明该估计不是p2的无偏估计。(需要写出详细推导过程)。
(2)(6分)令M=X1X2,证明M是p2的无偏估计。
(3)(8分)寻找p2的最小方差无偏估计(需要写出具体形式)。
解:(1)似然函数:
对似然函数取对数:
当对数似然函数求偏导并令其为0时,对应的p(∧)即为所求。
令
则
根据最大似然估计的一致性可知,p2的最大似然估计为
因此最大似然估计不是无偏估计。
(2)由于X1,X2是来自同一分布的独立随机样本,因此E(X1X2)=E(X1)E(X2)=p2,所以M是p2的无偏估计。
(3)取
由ET=p2,得T是p2的无偏估计。
又因为是p的完全统计量,根据Lehmann-Scheffe定理,T是p2的最小方差无偏估计。
五、(22分)总体X服从如下分布。X1,…,X4为其样本量为4的简单随机样本。
令
其中I为示性函数。针对假设H0:θ=1/3 v.s. H1:θ=1/4构建拒绝域C{(x1,x2,x3,x4):T(x1,x2,x3,x4)>2}。
(1)(12分)求此检验的第一类错误概率α与第二类错误概率β。
(2)(10分)请判断此检验是否为显著性水平为α时的最优检验(most powerful test)。
解:(1)犯第一类错误的概率
犯第二类错误的概率
(2)令Yi=I(Xi=0),那么样本的似然函数为
其中
所以似然比为:
所以拒绝域为{X:λ(X)>C},其中C满足P[λ(X)>C]=α=1/9。
由于T取整数,求得拒绝域为{X:T>2},由NP引理知这个拒绝域为UMPT。
综上,题目中的拒绝域为水平为α的UMPT。