从零进阶!数据分析的统计基础(第2版)
上QQ阅读APP看本书,新人免费读10天
设备和账号都新为新人

1.5 重要知识点回顾

数据分析的概念:数据分析是指通过某种方法和技巧对准备好的数据进行探索、分析,从中发现因果关系、内部联系和业务规律等分析结果,为特定的研究或商业目的提供参考。

数据分析的三方面:明确的目的、适当的数据分析方法、有价值的结果。

数据分析的步骤:明确分析目的和内容、数据预收集、数据预处理、数据分析、数据展现和报告撰写共六个步骤。

数据分析方法根据使用的工具和理论的难度分成四个层次:单纯的数据加工方法;数理统计分析方法;数据挖掘方法和大数据分析方法。单纯的数据加工方法理论是简单的数学知识,使用SQL+Excel就可以完成;数理统计分析方法的理论基础是概率论和微积分,需要使用SPSS Statistics、SAS EG等分析工具;数据挖掘方法的理论基础是高等数学,其基本原理比较简单,是根据前期数据得出规则,然后根据规则进行预测和分析,需要使用SPSS Modeler、SAS EM和R软件等分析工具;而大数据分析方法的理论基础就是数据挖掘,使用的是Hadoop、Mahout、Spark、Storm等大数据分析工具。在实际的数据分析过程中,数据分析师应根据数据分析的目标,选择适当的数据分析方法,如果能用简单的数据分析方法解决问题,就不要选择复杂高深的算法。