2.1 单组设计一元定量资料t检验与符号秩和检验
2.1.1 问题与数据
【例2-1】已知玉米单交种群105的平均穗重为300g。喷药后,随机抽取9个果穗,其穗重分别为308g、305g、311g、298g、315g、300g、321g、294g、320g。问:喷药后,与喷药前的果穗平均重量之间的差别是否具有统计学意义?
【例2-2】已知某常规育种水稻平均单株产量为250g,经杂交培育后,随机抽取10株,测得单株产量分别为272g、200g、268g、247g、267g、246g、373g、216g、206g、246g。问:杂交培育的水稻平均单株产量与常规育种水稻平均单株产量之间的差别是否具有统计学意义?
这两个例子基本相同,以例2-1来进行详细分析,遇到不同之处再专门说明。
2.1.2 对数据结构的分析
在例2-1中,整个资料只涉及一个组,即用某法重复测定果穗重量9次,得到9个数据,故应属于“单组设计”。因指标(果穗重量)为测量得到且可带小数,故该资料属于定量资料,即这是单组设计一元定量资料。
2.1.3 分析目的与统计分析方法的选择
该研究分析目的是考察该9个样品所代表的总体均值与标准值之间的差别是否有统计学意义,因此统计分析应该属于单组设计定量资料的统计分析。若定量资料满足独立性和正态分布要求,可进行单组设计一元定量资料t检验,此时,可求出该定量指标的总体平均值的95%置信区间;否则,应进行单组设计一元定量资料符号秩和检验,此时,可基于非参数法求出该定量指标的总体中位数的95%置信区间。
2.1.4 SAS程序中重要内容的说明
例2-1资料的程序名为SASTJFX2_1.SAS。
例2-2资料的程序名为SASTJFX2_2A.SAS,可以与例2-1程序完全相同,注意用新数据替换原来的数据,别忘了将Mu0=300改为Mu0=250;但这里还给出另一种形式,供读者选用,设程序名为SASTJFX2_2B.SAS。
DATAPGM2_2B; INPUT X @@; Y=(X-250); CARDS; 272200 268247 267246 373216 206246 ; RUN; ODS HTML; PROCUNIVARIATENORMAL; VAR Y;RUN;PROCMEANS; VAR X;RUN; ODS HTML CLOSE;
注意:“Y=X−250;”是一个赋值语句,应根据具体情况修改标准值250。
2.1.5 主要分析结果及解释
对例2-1而言,首先看关于正态性检验的结果。W=0.954097、P=0.7350>0.05,可以认为这组定量数据服从正态分布;再看t检验的结果,并结合统计学知识和专业知识给出统计学结论和专业结论。本例,t=2.495401、P=0.0372<0.05,故按α=0.05水准,拒绝H0(μ0=300),接受H1(μ0≠300),可以认为喷药后果穗重量的均值与标准值(300g)之间的差别有统计学意义。
专业结论:因X=308g,标准值为300g,结合统计学结论,可以认为喷药后果穗重量的均值高于标准值。求得总体平均值的95%置信区间为(300.6,315.4)g。
对例2-2而言,由SASTJFX2_2B.SAS程序输出的主要结果如下:
首先查看关于变量Y的正态性检验的结果,有W=0.836851、P=0.0404<0.05,故可以认为这组定量资料不服从正态分布;接着就应查看符号秩和检验的结果,即位置检验:Mu0=0的最后一行,并结合统计学知识和专业知识给出统计学结论和专业结论。本例,S= −2.5、P=0.8262>0.05,故按α=0.05水准,认为此样本所代表的总体中位数与给定的标准值250g之间的差别无统计学意义。
专业结论:可认为该类水稻杂交培育后的单株产量的总体中位数与常规育种的平均单株产量(250g)接近相等。求得中位数为246.5g,其95%置信区间为(206.0,272.0)g。注意,关于中位数及其置信区间需查看本例第1个程序输出的结果中“分位数”部分。在本例中,由于变量X并不服从正态分布,所以描述其平均水平时使用中位数,相应的需要计算中位数的95%可信区间,由于输出结果中关于分位数置信区间部分的内容较多,此处从略。