Python大数据分析算法与实例
上QQ阅读APP看书,第一时间看更新

2.2.2 数据相关分析的主要内容

相关分析是指对客观现象的相互依存关系进行分析、研究,这种分析方法叫相关分析法。相关分析的目的在于研究相互关系的密切程度及其变化规律,以便做出判断,进行必要的预测和控制。下面介绍相关分析的主要内容。

(1)确定现象之间有无相关关系

这是相关与回归分析的起点,只有存在相互依存关系,才有必要进行进一步的分析。

(2)确定相关关系的密切程度和方向

确定相关关系的密切程度主要是通过绘制相关图表和计算相关系数。只有对达到一定密切程度的相关关系,才可配合具有一定意义的回归方程。

(3)确定相关关系的数学表达式

为确定现象之间变化上的一般关系,我们必须使用函数关系的数学公式作为相关关系的数学表达式。如果现象之间表现为直线相关,就可采用配合直线方程的方法;如果现象之间表现为曲线相关,就可采用配合曲线方程的方法。

(4)确定因变量估计值的误差程度

使用配合直线或曲线的方法可以找到现象之间一般的变化关系,也就是自变量x变化时,因变量y将会发生多大的变化。根据得出的直线方程或曲线方程可以给出自变量的若干数值,求得因变量的若干个估计值。估计值与实际值是有出入的,确定因变量估计值误差大小的指标是估计标准误差。估计标准误差大,表明估计不太精确;估计标准误差小,表明估计较精确。