2020年统计学考研真题(含复试)与典型题详解
上QQ阅读APP看本书,新人免费读10天
设备和账号都新为新人

第5章 概率基础

5.1 知识要点总结

一、随机事件及其概率

1.随机事件的几个基本概念

随机事件:在同一组条件下,每次试验可能出现也可能不出现的事件,也称作偶然事件。

必然事件:在同一组条件下,每次试验一定出现的事件。

不可能事件:在同一组条件下,每次试验一定不出现的事件。

基本事件:如果一个事件不能分解成两个或更多个事件,则这个事件称为基本事件(或简单事件)。

样本空间:一个试验中所有的简单事件的全体称为样本空间或基本空间,记为

2.事件的概率

(1)概率的古典定义

如果某一随机试验的结果有限,而且各个结果出现的可能性相等,则某一事件A发生的概率为该事件所包含的基本事件数m与样本空间中所包含的基本事件数n的比值,记为:

(2)概率的统计定义

在相同条件下随机试验n次,某事件A出现m次(m≤n),则比值m/n 称为事件A发生的频率。随着n的增大,该频率围绕某一常数p上下波动,且波动的幅度逐渐减小,趋于稳定,这个频率的稳定值即为该事件的概率,记为:

(3)主观概率定义

主观概率是指对一些无法重复的试验,只能根据以往的经验,人为确定这个事件的概率。

它是一个决策者根据个人掌握的信息对某个事件发生可能性的判断。

二、概率的性质与运算法则

1.概率的性质(公理化定义)

(1)非负性

对任一随机事件A,有

(2)规范性

必然事件的发生概率为1,而不可能事件发生的概率为0,即

(3)可列可加性

若A与B互斥,则

对于多个两两互斥的随机事件,则

2.概率的加法法则

法则1两个互斥事件之和的概率等于两个事件概率之和。

设A和B为两个互斥事件,则

对A和两个事件来说,则有

法则2对于任意两个随机事件,它们和的概率为两个事件各自的概率之和减去两事件交集的概率。即

3.条件概率与独立事件

(1)条件概率

当某一事件B已经发生时,求事件A发生的概率,称这种概率为事件B发生条件下事件A发生的条件概率,记为。一般来说,,只有当A与B独立时,才成立。

(2)乘法公式

条件概率与概率P(AB)、P(B)的关系:

则概率的乘法公式为:

,或

(3)独立性

相互独立事件:两个事件中一个事件的发生与否并不影响另一个事件发生的概率,即

多个事件相互独立,即如果A1,A2,…,An相互独立,则

相依事件:一个事件的发生与否会影响另一个事件的发生。

独立事件与互斥事件的关系:互斥事件是指一个事件发生则另一事件一定不发生,故互斥事件一定不是独立事件;独立事件是指两个事件的发生不会相互影响,当一个事件发生时另一个事件是否发生并不确定,故独立事件可能是互斥事件也可能不是。

4.全概率公式及贝叶斯公式

(1)全概率公式

设n个事件A1,A2,…,An互不相容,,事件B满足:

(2)贝叶斯公式(逆概率公式)

设n个事件A1,A2,…,An互不相容,,事件,则

其中,P(Ai)和P(Ai|B)分别称为事件Ai的验前概率和验后概率。

三、离散型随机变量及其分布

1.相关概念

(1)概率函数

在同一组条件下,如果每次试验可能出现这样或那样的结果,并且所有的结果即X的所有可能值都能列举出来,而且X的可能值具有确定概率

就称为随机变量X的概率函数,X称为P(X)的随机变量。

(2)两种类型的随机变量

离散型随机变量

如果随机变量X的所有取值都可以逐个列举出来,则称X为离散型随机变量。

连续型随机变量

如果随机变量X的所有可能取值不可以逐个列举出来,而是取数轴上某一区间内的任一点,则称该随机变量为连续型随机变量。

2.离散型随机变量的概率分布

(1)离散型随机变量的概率分布

设有一离散型随机变量X,其可能取值为,相应的概率为p1,p2,…,pn,即(i=1,2,…,n)。将上述对应用表格形式表示,即为离散型随机变量X的概率分布,如表5-1所示。

表5-1 概率分布

其中,P(X=xi)=pi是X的概率函数,并且

(2)离散型随机变量的期望值和方差

期望值

在离散型随机变量X的一切可能值的完备组中,各可能值xi与其对应概率pi的乘积之和称为该随机变量X的期望值,记作E(X)或μ。

a.若X取有限个数值:x1,x2,…,xn,其对应的概率为p1,p2,…,pn,则期望值为:

b.若X取无限个数值:x1,x2,…,xn,…,其对应的概率为p1,p2,…,pn,…,则期望值为:

方差与标准差

随机变量的方差是用来反映随机变量取值的离散程度的,它是每一个随机变量取值与期望值的离差平方之期望值,即。方差的平方根为标准差,即

若X的取值比较集中,则方差较小;若X的取值比较分散,则方差较大。如果方差为0,则意味着随机变量取值集中在期望值E(X),即随机变量取值为E(X)的概率为1。

(3)二项分布和泊松分布

二项分布

贝努里试验的性质:

a.试验包含了n个相同的试验;

b.每次试验只有两个可能的结果:“成功”或“失败”;

c.“成功”的概率p对每一次试验是相同的,“失败”的概率q也不变,且p+q=1;

d.每次试验是互相独立的;

e.试验“成功”或“失败”可以计数,即试验结果对应于一个离散型随机变量。

若随机变量X表示n次重复独立试验中事件A(成功)出现的次数,那么

则称随机变量X服从二项分布,参数为n,p,记做X~B(n,p)。

特别地,当n=1时,二项分布化为0~1分布,即

二项分布的期望值和方差分别为:E(X)=np,D(X)=npq。

泊松分布

泊松分布是用来描述在一指定时间范围内或在指定的面积或体积之内某一事件出现的个数的分布。

泊松分布的概率分布公式为:

泊松分布的期望值和方差都为参数λ,即:

在n重贝努里试验中,当“成功”的概率很小(即p→0),试验次数很大时,二项分布可近似等于泊松分布,即此时

在实际应用中,当p=0.25,n>20,np=5时,用泊松分布近似二项分布效果良好。

四、连续型随机变量的概率分布

1.概率密度与分布函数

概率密度函数f(x)应满足两个条件:f(x)≥0;

分布函数定义为:

连续型随机变量的概率密度是其分布函数的导数,即

连续型随机变量的期望值与方差分别定义为:

2.正态分布

(1)正态分布的定义及图形特点

如果随机变量X的概率密度为:

则称X服从正态分布,记作

正态分布的概率密度f(x)的性质:

f(x)≥0,即整个概率密度曲线都在x轴的上方。

曲线f(x)关于x=μ对称,并在x=μ处达到最大值,

曲线的陡缓程度由σ决定:σ越大,曲线越平缓;σ越小,曲线越陡峭。

当x趋于无穷时,曲线以x轴为其渐近线。

(2)标准正态分布

对于正态分布,如果μ=0,σ=1时,则有

相应的正态分布N(0,1)称为标准正态分布。对标准正态分布,通常用φ(x)表示概率密度函数,用Φ(x)表示分布函数。

标准正态分布的重要性在于,任何一个一般的正态分布都可以通过线性变换转化为标准正态分布,即:若

那么:

(3)正态分布表

只要将一般正态分布转化为标准正态分布,通过查表,就可解决正态分布的概率的计算问题。对于负的变量值对应的概率,可由得到。

(4)3σ准则

当X~N(μ,σ2)时,有

可以认为X的值几乎一定落在区间(μ-3σ,μ+3σ)内,即“3σ准则”。

(5)二项分布的正态近似

设随机变量X~B(n,p),则对任意x,有

定理表明,二项随机变量X近似服从正态分布N(np,np(1-p))。