实验3-3 成对样本T检验
素材文件:sample/Chap03/kexiping.sav
多媒体教学文件:视频/实验3-3.mp4
实验基本原理
成对样本的T检验用于检验两个相关的样本是否来自于具有相同均值的正态总体,如果我们假设来自两个正态总体的配对样本为(X1, Y1), (X2, Y2), … (Xn, Yn),令Di=Xi-Yi(i=1, 2, …, n),相当于检验样本Di(i=1,2,…,n)是否来自于均值为零的正态总体,则检验假设H0:μ=μ1-μ2=0。成对样本的T检验实际上是先求出每对观测值之差,然后求各差值的均值。检验成对变量是否有显著性差异,其实质就是检验差值的均值与零均值之间差异的显著性,如果差值与零均值没有显著性差异,则表明成对变量均值之间没有显著性差异,注意这个检验使用的同样是T统计量,仍然以T分布作为其理论基础。
需要特别说明和强调的是,并不是所有的数据都适合于成对样本T检验过程,即便数据适合,也不是在所有情况下都适宜采用成对样本T检验过程。在SPSS官方网站的帮助文档《IBM_SPSS_Statistics_Base》中,对“成对样本T检验”检验方法的应用条件进行了特别指导:数据方面,对于每个成对检验,指定两个定量变量(定距测量级别或定比测量级别),对于匹配对或个案控制研究,每个检验主体的响应及其匹配的控制主体的响应必须在数据文件的相同个案中。假设条件方面,每对的观察值应在相同的条件下得到,平均值差值应是正态分布的,每个变量的方差可以相等也可以不等。
实验目的与要求
实验目的:通过实验了解配对样本T检验的意义,对比这种方法和独立样本T检验的异同,从而能够在恰当的情形恰当地使用成对样本的T检验方法对成对的样本数据进行检验。
实验要求:理解成对样本T检验的统计量的计算方法和分布性质;了解成对样本T检验的统计量服从T分布的原理;熟练运用SPSS中的成对样本T检验过程对成对样本数据进行检验,并能够对分析结果进行正确地解释。
实验内容及数据来源
本次实验所用的数据是10例矽肺病患者经克矽平治疗前后血液中的血红蛋白量(g/dl),数据中有10个样本观测值,代表了10个接受治疗的患者;有两个属性变量x1和x2,分别代表的是患者治疗前后的血红蛋白量,图3-11给出了该数据,数据文件见本书附赠资源的Chap03文件夹下的“kexiping.sav”文件。本实验的内容是使用成对样本的T检验判断这种治疗对患者的血红蛋白量有没有显著的影响。
图3-11 kexiping.sav文件的数据
实验操作指导
实验的操作步骤如下:
01 选择“文件︱打开︱数据”命令,打开kexiping.sav数据表。
02 选择“分析︱比较平均值︱成对样本T检验”命令,弹出“成对样本T检验”对话框,如图3-12所示。
图3-12 “成对样本T检验”对话框
03 在左侧变量框中同时选中“治疗前(x1)”和“治疗后(x2)”两个变量,单按钮将其选入右侧的“配对变量”列表框中。注意这里可以引入多个成对样本,每对样本会给出一个T检验结果,由于我们只有两个变量,因此只能组成一对成对变量。另外,“选项”功能和单样本T检验的情况相同,这里就不赘述了,需要改变默认设置的读者可以参照实验3-1中的方法自行设置。单击“确定”按钮,进入计算分析。
计算机运行完成后得到的结果如图3-13~图3-15所示。
实验结论
图3-13给出了几个基本的配对样本的描述性统计量,包括治疗前后的均值、标准差等,从这里可以直观地看出治疗前后的患者血红蛋白量的均值差别不大(分别为12.590和13.270)。
图3-14给出了两配对样本之间的相关系数,相关系数的值为0.319,说明两组样本值之间的相关性不强,这也从侧面说明治疗前后样本值之间没有很明显的差异。
图3-13 配对样本统计量
图3-14 成对样本相关系数
图3-15给出了正式的配对检验结果,从图中看到T统计量的值为-1.307,双尾显著性水平(Sig.(双尾))的P值为0.224,远大于0.05,因此我们拒绝原假设,这样可以认为用克矽平治疗矽肺病患者对血红蛋白量没有显著的作用。
图3-15 成对样本检验结果