数据挖掘实用案例分析
上QQ阅读APP看书,第一时间看更新

1.1 业务理解

数据分析过程中需要理解需求和分析目标,深入理解与分析目标相关联的业务背景,包括行业知识、领域知识及业务流程等,若数据分析人员对业务背景不熟悉,其分析方法和过程就难以贴合实际需求。业内专业人员往往以数据分析人员分析的结论为常识。

为了从数据中挖掘出有价值的结果,与领域专家进行充分交流,要亲临一线去了解业务实际情况,切忌“数据空想”,对业务知识理解其逻辑和原理,不仅有助于在数据预处理过程中对异常数据进行甄别和剔除,而且有助于分析过程中数据探索和挖掘方法的选择,对于结果是否符合预期,也可直观得出结论,否则容易出现模型的准确率虽然很高,经过业务专家评价时发现模型的某一自变量为目标变量的特征表现,最终模型毫无价值。

对数据分析目标的理解,包括定性分析和定量分析,前者给出与目标变量关联的自变量列表或目标变量的性质预测等,后者除了列举相关自变量,还要对其权重等进行定量分析,在实际数据分析过程中,需要依据不同的业务目标设计分析方案。

在业务理解中,要以方法论的层面进行流程梳理,以实现快速确认分析目标相关联的影响因素,将分析过程以结构化的方式展现,利于理顺思路,而且不局限于某一行业应用,只要变换行业影响因素,即可应用于其他行业。例如,在企业经营活动的分析中,可以应用图1.1所示的分析框架,其中主要包括产业基础、企业运营分析、企业财务分析、竞争分析、营销分析、客户分析,此分析框架基本涵盖了大部分的企业经营活动,具体分析中可以适当进行增减和完善,并且可以按照不同的行业进行细化,形成行业分析框架。

图1.1 企业经营活动分析框架

对业务理解的分析框架中,主要从宏观的角度结构化、模块化指导数据分析,把问题分解成各个相关联的子模块,为后续数据分析进行规划,起到提纲挈领的作用。