统计挖掘与机器学习:大数据预测建模和分析技术(原书第3版)
上QQ阅读APP看书,第一时间看更新

10.7.1 FD2_OPEN的重述

对FD2_OPEN进行重述是和重述FD1_OPEN一样的。重述FD2_OPEN并不奇怪,因为FD1_OPEN和FD2_OPEN共享了大量信息。这两个变量的相关系数是0.97,意味着这两个变量有94.1%的变化是一致的。所以我喜欢用FD2_RCP作为FD2_OPEN的最佳重述变量(参见表10.9)。

表10.9 LGT_TXN和FD2_OPEN的重述变量之间的相关系数