第三节 变量间关系分析的基本内容
某种意义上,应用统计分析可以看作是变量间关系的分析。由于分析的关系变量有1个、2个及多个之分,所以相对应的单一变量分析、两个变量间关系分析和多个变量间关系分析构成了应用统计分析的基本内容。
一、单一变量分析
单一变量分析,即单纯对一个变量的统计分析。由于变量有数值变量和分类变量,分析包括统计描述和统计推断,所以单一变量分析实际上有数值变量的统计描述和统计推断、分类变量的统计描述和统计推断4个内容,详见第四章。
二、双变量间关系的分析
双变量关系分析是指一个因变量(结果变量)与一个自变量(影响变量)之间关系的分析,是应用统计分析最为重要、基本的内容,包括二项分类变量、多项无序分类变量、多项有序分类变量、数值变量4种变量交叉组合形成的16种关系的分析,涵盖了现有统计学分析中大部分统计推断的内容。严格来讲,两变量关系分析还包括统计描述的内容,如两个变量之间交叉关系的分类频数列表,必要时单独列出,一般情况下不作要求,故未述及。
实际上,统计学的假设检验是变量与变量之间关系分析的重要内容。其选择分析方法的步骤是:第一分清楚哪是结果变量(因变量),哪是影响变量(自变量);第二确定各自的变量类型,包括二项分类变量、多项无序分类变量、多项有序分类变量和数值变量;第三,结合研究分析的目的;最后,考虑不同统计学分析方法的应用条件。
当结果变量(因变量)和影响变量(自变量)的变量类型确定后,可按表3-2中两变量关系分析的16种组合情况,对应选择各种不同的统计分析方法。
当有多种分析方法时,表中“☆”一般表示为优先选择的分析方法,是重点介绍的内容,如,对多项有序分类变量与多项无序分类变量关系的分析时可选用Kruskal-Wallis H秩和检验、Ridit分析和R×C卡方检验,其中Kruskal-Wallis H秩和检验为最佳分析方法,其他方法如R×C卡方检验,实际上是将多项有序分类变量降级为多项无序分类变量后而进行的分析,可参照多项无序分类变量与多项无序分类变量关系的分析,一般不作重复介绍。
三、多变量关系的分析
理论上讲,统计分析除了单一变量的统计分析、双变量的关系分析以外,其他诸如一个自变量和多个因变量、多个自变量和多个因变量之间关系的分析当属多变量关系分析的内容。由于分类变量与数值变量各不相同,不同个数不同变量的组合方式多种多样,所以相应的统计方法也有很多种,主要有:1个数值变量与多个数值变量之间的关系,如多元相关回归分析;1个数值变量与多个分类变量之间的关系,如多因素方差分析、重复设计方差分析;1个数值变量与混合多个变量之间的关系,如协方差分析、COX模型;1个分类变量与混合多变量之间的关系,如Logistic回归分析;多个数值变量与多个数值变量之间的关系,如典则相关等。
限于目前的统计方法,有的内容尚无对应的统计分析,有待进一步研究;为统一起见,本书中变量与变量之间关系特指结果变量与影响变量的关系。