SAS统计分析教程
上QQ阅读APP看本书,新人免费读10天
设备和账号都新为新人

4.1 随机区组设计一元定量资料方差分析与Friedman秩和检验

4.1.1 问题与数据

【例4-1】某研究者欲比较3种抗癌药物对小白鼠肉瘤的抑瘤疗效,首先,将15只染有肉瘤的小白鼠按体重大小配成5个区组,使每个区组内的3只小白鼠体重最接近;然后随机决定每个区组中的3只小白鼠接受3种药物的治疗,以肉瘤的重量为指标。实验结果如表4-1所示。试比较不同抗癌药物对小白鼠肉瘤的抑瘤效果之间的差别是否有统计学意义。

表4-1 不同药物作用后小白鼠肉瘤重量

4.1.2 对数据结构的分析

在此实验中,实验因素为“药物种类”。它有3个水平,分别为A、B、C药。受试对象为小白鼠,观测指标为肉瘤重量。此外,还有一个区组因素,即按体重形成的区组。研究者先按照体重大小将15只小白鼠配成5个区组,然后将每个区组内的3只小白鼠随机分到3个药物组内进行实验,因此此设计应为随机区组设计。

4.1.3 分析目的与统计分析方法的选择

研究者欲比较不同抗癌药物对小白鼠肉瘤的抑瘤效果之间的差别是否有统计学意义。在资料满足参数检验的前提条件时,可采用随机区组设计定量资料方差分析。若资料不满足参数检验的前提条件,可采用Friedman秩和检验。

4.1.4 SAS程序

SAS程序名为SASTJFX4_1A.SAS。

程序第1步通过两个循环语句建立数据集sastjfx4_1A,其中a代表区组因素,b代表实验因素“药物种类”。第2步、第3步是分别对a因素各水平组、b因素各水平组进行正态性检验,并将正态性检验结果分别输出到数据集set1、set2中,正态性检验统计量记为W,相应概率记为P,以便后面调用。第4步合并两因素各水平正态性检验结果,以便将其一起输出,便于查看。第5步、第6步分别对a因素各水平组、b因素各水平组进行方差齐性检验,并将方差齐性的检验结果分别输出到数据集set3、set4中,采用的方法是SAS默认的Levene法。第7步合并两因素各水平方差齐性的检验结果,以便将其一起输出,便于查看。第8步是调用GLM过程进行随机区组设计定量资料方差分析,并对实验因素b各水平进行两两比较。

若资料不满足参数检验的前提条件,可采用Friedman非参数检验方法。假设例4-1资料不满足参数检验的前提条件,需进行Friedman非参数检验,SAS程序名为SASTJFX4_1B.SAS。

4.1.5 主要分析结果及解释

这是分别对区组因素a和实验因素b所做的正态性检验结果,第1列为区组因素a及其5个水平,第2列为实验因素b及其3个水平,第3列为正态性检验的统计量W值,第4列为统计量W对应的P值。由第4列可以看出,a、b两因素各水平对应的正态性检验结果P值均大于0.05,可认为资料满足正态性要求。

这是对a、b两因素各水平进行方差齐性检验的结果,对应的P值分别为0.2140、0.3782,均大于0.05,可认为满足方差齐性条件。为节省篇幅,此处只列出了方差齐性检验的结果。其实,在对a、b两因素各水平进行方差齐性检验时,程序运行的结果中还列出了以a因素为分组因素进行单因素5水平设计定量资料方差分析的结果,列出了以b因素为分组因素进行单因素3水平设计定量资料方差分析的结果。这些结果是方差齐性检验的副产品,与随机区组设计定量资料方差分析主题无关,读者可不予关注。

这是随机区组设计一元定量资料方差分析的结果,a、b两因素对应的P值分别为0.0158、0.0040,说明两因素各水平对观测指标的影响之间的差异都有统计学意义。即不同体重、不同药物对肉瘤重量的影响是不完全相同的。

Student-Newman-Keuls Test for y

这是对实验因素b各水平组之间进行两两比较的结果,由于“SNK Grouping”列字母不全相同,说明因素b的1水平和2、3水平之间的差异有统计学意义,而2水平和3水平之间的差异则无统计学意义。b因素3个水平所对应的观测指标的均值分别为0.614、0.434、0.314,说明C药对肉瘤重量的影响大于A药和B药,因为肉瘤重量越小,药物的医疗效果就越好。

以下是对例4-1进行Friedman秩和检验的结果。

The FREQ Procedure Summary Statistics for b by y Controlling for a

对随机区组设计定量资料进行Friedman秩和检验时,可采用CMH检验进行统计分析,选择scores=rank选项,那么CMH检验计算出来的行平均得分差异统计量就等于Friedman秩和检验的结果。注意:因为CMH检验计算时以区组因素a为分层变量,以实验因素b为行变量,以结果变量y为列变量,构筑一个三维列联表,所以在tables语句后一定要注意三个变量的写作顺序—区组因素*实验因素*结果变量。查看上表中的行平均得分差异统计量,其值为8.40,对应的P值为0.0150,说明b因素各水平对观测指标平均值的影响之间的差异有统计学意义。