2.2.3 相关关系的测定
相关分析的主要方法有相关表、相关图和相关系数3种。下面详细介绍这3种方法。
(1)相关表
在统计中,制作相关表或相关图可以直观地判断现象之间大致存在的相关关系的方向、形式和密切程度。
在对现象总体中两种相关变量进行相关分析,以研究其相互依存关系时,如果将实际调查取得的一系列成对变量值的资料顺序地排列在一张表格上,这张表格就是相关表。相关表是统计表的一种。根据资料是否分组,相关表可以分为简单相关表和分组相关表。
①简单相关表
简单相关表是资料未经分组的相关表,它是一种把自变量按从小到大的顺序并配合因变量一一对应、平行排列起来的统计表。
②分组相关表
在大量观察的情况下,原始资料很多,运用简单相关表就很难表示。这时就要将原始资料进行分组,然后编制相关表,这种相关表称为分组相关表。分组相关表包括单变量分组相关表和双变量分组相关表两种。
- 单变量分组相关表。在原始资料很多时,对自变量数值进行分组,而对应的因变量不分组,只计算其平均值。根据资料的具体情况,自变量可以是单项式,也可以是组距式。
- 双变量分组相关表。对两种有关变量都进行分组,交叉排列,并列出两种变量各组间的共同次数,这种统计表称为双变量分组相关表。这种表格形似棋盘,故又称棋盘式相关表。
(2)相关图
相关图又称散点图。它是以直角坐标系的横轴代表自变量x,纵轴代表因变量y,将两个变量间相对应的变量值用坐标点的形式描绘出来,用来反映两个变量之间相关关系的图形。
相关图可以按未经分组的原始资料来编制,也可以按分组的资料,包括按单变量分组相关表和双变量分组相关表来编制。通过相关图将会发现,当y对x是函数关系时,所有的相关点都会分布在某一条线上;在相关关系的情况下,由于其他因素的影响,这些点并非处在一条线上,但所有相关点的分布会显示出某种趋势。所以相关图会很直观地显示现象之间相关的方向和密切程度。
(3)相关系数
相关表和相关图大体说明变量之间有无关系,但它们的相关关系的紧密程度却无法表达,因此需运用数学解析方法构建一个恰当的数学模型来显示相关关系及其密切程度。如果要对现象之间的相关关系的紧密程度做出确切的数量说明,就需要计算相关系数。
接下来介绍相关系数的计算。相关系数是在直线相关条件下,说明两个现象之间关系密切程度的统计分析指标,记为γ。
相关系数的计算公式为:
式中,n表示资料项数,表示x变量的算术平均数,表示y变量的算术平均数,表示x变量的标准差,表示y变量的标准差,表示xy变量的协方差。
在实际问题中,如果根据原始资料计算相关系数,可运用相关系数的简捷法计算,其计算公式为:
(4)相关系数的分析
明晰相关系数的性质是进行相关系数分析的前提。现将相关系数的性质总结如下:
①相关系数的数值范围在-1和+1之间,即-1≤γ≤1。
②计算结果,当γ>0时,x与y为正相关;当γ<0时,x与y为负相关。
③相关系数γ的绝对值越接近1,表示相关关系越强;越接近于0,表示相关关系越弱。若|γ|=1,则表示两个现象完全直线相关。若|γ|=0,则表示两个现象完全不相关(不是直线相关)。
④相关系数γ的绝对值在0.3以下表示无直线相关,0.3以上表示有直线相关,0.3~0.5表示低度直线相关,0.5~0.8表示显著相关,0.8以上表示高度相关。