思考题及答案要点
1.统计推断的前提条件是什么?
答:统计推断的前提条件是随机抽取足够多的样本。其中,随机意味着总体中的每个个体被抽到的机会相同;而足够多的样本则能充分地反映总体。
2.统计推断的理论基础是什么?
答:统计推断的理论基础是大数定理、中心极限定理和小概率事件原理。
3.检验员从100袋牛奶中抽取20袋,如何利用随机数表产生样本?
答:随机数表由数字0~9组成,每个数字在表中各位置出现的次数都是一样的(可参考统计书所附的随机数表)。先将100袋牛奶从0~99编号,再从随机数表中任选一个数,如选择表中第9行第5列的数1(为便于说明问题,摘取随机数表中第9~10行),最后从选定的数1向右读,得到一个两位数12(小于99,说明12在总体内),将其取出。继续向右读,得到34,如此反复,直至样本的10个号码全部取出。
33 21 12 34 29 78 64 56 07 82 52 42 07 44 38 15 51 00 13 42 99 66 02 79 54
57 60 86 32 44 09 47 27 96 54 49 17 46 09 62 90 52 84 77 27 08 02 73 43 28
4.本章例1在简单随机抽样中,为何不将零件从1~1000编号?
答:若这样编号,从随机数表中读取三位数字,永远抽不到编号为1000的零件,这与随机抽样要求每个个体被抽到的机会均等矛盾。虽然从随机数表读取四位数字可解决此问题,但读到的四位数字,绝大多数大于1000,这样频繁地废弃后再重新读数,致使产生100个样本编号的时间大大延长。因在等距抽样中不存在这个问题,故本例在采用等距方法抽样时,可对零件从1~1000编号。
5.下列数据哪些是计量值数据:血压值120毫米汞柱、工时利用率90%、实弹射击成绩9.8环、产品早返率2.5%(200个有5个早返)、一块玻璃上的3个气泡。
答:血压值120毫米汞柱虽然是整数,但质量特性值血压可以取小数,所以是计量值数据;表示工时的小时、分钟和秒虽然用整数,但可以将它们转化为小时,本质上可以取小数,计量值的百分率一定是计量特性值数据;射击成绩9.8环因可以取小数,故是计量值数据;产品早返个数“5”是计件值数据,不连续,所以产品早返率是不连续数据,是计件值数据;而玻璃上的气泡数3则是计点值数据。
6.为什么,请演示推导过程。
答:该题目的是熟悉数学期望与方差性质,为后续理解Cpm和Cpmk存在的问题打基础。
7.设随机变量X与Y相互独立,它们的均值分别为1与2,方差分别为3与4,则随机变量Z=5X+6Y的均值与方差分别为多少?
答:E(5X+6Y)=5E(X)+6E(Y)=5×1+6×2=17;
Var(5X+6Y)=25Var(X)+36Var(Y)=25×3+36×4=75+144=219。
8.某质量工程师为了解加工过程能力抽样测量零件尺寸,尺寸要求为1.540mm±0.005mm,每隔半小时抽5个零件,上午抽取8次,测得零件尺寸见表1-7。请问,在计算标准差时,若将所测得每个数据都减去1.540,再计算标准差,结果有无变化。
表1-7 工件尺寸抽样测量数据表(单位:mm)
答:无变化,都是0.002049。根据方差性质,Var(X)=Var(X-c)。这意味着不管质量特性值同减去什么值(常数c),计算出的标准差值不变。读者可采用Excel表自行验证。
9.如何理解“无论正态分布曲线的均值μ如何变化即中心位置如何变化,都不改变正态分布曲线的形状,即标准差σ不变。”这句话?
答:根据数学期望和方差的性质有:E(X±c)=E(X)±c; Var(X±c)=Var(X)。这意味着当产品质量特性值X都加上(或减去)一个常数c,致使均值发生变化时,产品质量特性的这组数据的标准差不变。即无论正态分布曲线均值μ如何变化,标准差σ不变。
10.标准差为1的正态分布是标准正态分布吗?
答:不是,只有均值为零且标准差为1的正态分布才是标准正态分布。
11.面积、分布概率、合格(缺陷)率的区别是什么?
答:面积与分布概率是一个概念,都是相对于一定区间范围而言的。当区间是合格区间时,面积和分布概率就是合格率;当区间是缺陷率区间时,面积和分布概率就是缺陷率。
12.φ(x)与φ(u)和Φ(u)的区别是什么?
答:φ(x)是标准正态分布概率密度函数;φ(u)是φ(x)在x=u时的概率密度函数值;Φ(u)是曲线φ(x)在区间[ -∞, u]内的分布概率(面积)。
13.附表1中对于u=1时查得的结果是Φ(1)还是φ(1)?其含义是什么?
答:Φ(1),其含义是标准正态分布曲线落在区间[ -∞,1]内的面积,而φ(1)是标准正态分布函数φ(x)在u=1时的函数值。
14.对于任意a、b(a≤b),请写出计算一般正态分布概率密度函数p(x)落在区间[a, b]内分布概率的积分表达式和概率计算表达式。对于标准正态分布呢?
标准正态分布。
15.有人说:“对于具体的x(x>0)值,可由表中查得相应的φ(x), φ(x)值的几何意义是:曲线下左边的面积。如φ(1)=0.8413。当然,也可反查,如φ(x)=0.9904,查得u=2.34,即x=u=2.34。”这段话错在何处?
答:错误在于基本概念不清,混淆了大Φ与小φ的本质区别。应将所有的φ(x)改成Φ(x)。
16.在概率密度函数中,当σ→∞时,合格率趋近于什么?
答:不管公差大小如何,实践中公差范围总有界。假设公差范围为T,则T为有界函数(常数是函数的特例),即不超过某个具体值。当σ→∞时,由于概率密度函数p(x)→0,即p(x)为无穷小,对无穷小概念的通俗理解是“要多小,有多小”或“小得不能再小”。无穷小有一个性质:有界函数乘以无穷小还是无穷小。故当σ→∞时,合格率趋近于零。
17.为什么概率密度函数曲线在任意一点处积分为零?
答:因为面积为零。曲线只有在积分区间内才能谈分布概率,正态分布曲线也不例外。由于针对某一个x值并未形成积分区间,所以概率密度函数φ(x)在任意x处不能谈概率。如果可以谈的话,那么正态分布曲线在任意x处的概率为零。
18.为什么正态分布曲线落在区间[μ±σ]、[μ±2σ]、[μ±3σ]内的概率分别是68.26%、95.44%和99.73%?
答:运用正态分布概率计算通式并查附表1计算可得上述结果,计算过程略。
19.正态分布方差σ2的无偏估计是什么?
答:σ2的无偏估计是样本方差,即。
20.下列有关标准正态分布概率计算表示正确的有
A.Φ(a)=P(u<a)=P(u≤a)
B.P(u>a)=1-Φ(a)
C.Φ(-a)=1-Φ(a)
D.P(0≤u≤a)=Φ(a)-0.5
E.P(-a≤u≤a)=2Φ(a)-1
答:ABCDE都正确。
21.设X~N(1,4),计算P(0≤X≤2)=2Φ(0.5)-1对吗?
答:正确。但注意正态分布的正规表示应该是X~N(1,22)。
22.一批砝码平均质量为50g,标准差为0.01g,则质量在49.97~50.03g内的砝码约有多少?
答:2Φ(3)-1=99.73%。
23.一个样本由n个观察值组成,样本均值和样本标准差都大于零,若其中一个观察值等于样本均值,将该观察值从样本中除去,则样本均值和样本标准差将发生怎样变化?
答:样本均值不变,样本标准差增大(因为公式中的分子不变,分母n-1变小)。
24.数学期望E(X)的内涵是什么?举例说明它与均值的区别。
答:离散型随机变量的一切可能的取值xi与对应的概率P(X=xi)之积的和称为数学期望。例如,三人给一个应用软件系统打分(满分为10分),用户、程序员和专家分别给出了8、7、9分,三人对应的权重分别是0.3、0.3和0.4,则数学期望为8×0.3+7×0.3+9×0.4=2.4+2.1+3.6=8.1分。当三人权重相同(都是1/3)时,则数学期望为8.0分,此时的数学期望就是均值。可见,数学期望可理解成加权平均值,而均值是权重相同时的数学期望。