上QQ阅读APP看书,第一时间看更新
第2章 十几万健身房的选择——保险产品推荐
数据挖掘算法没有好坏,每种算法都有一定的适用范围。数据分析师可以根据数据以及数据分析需求的特点,大致选择几种方法,然后通过实验比较确定合适的挖掘算法,并逐步调优。
按照数据挖掘建模标准(CRISP-DM)的流程,首先要定义商业问题,理解业务背景,对业务需求有基本的了解,然后对相关的数据进行探索、预处理,分析其特点,进而确定几个可能的模型,并对其进行验证评估,最后选择分析结果较优的算法对其进一步调优,使结果尽量解决客户的问题,最后将模型进行应用部署。
上述流程中因实际数据挖掘中的任务目标和数据特征千差万别,像数据预处理等可忽略,但流程中任何一步出现问题,构建出来的模型可能就会毫无应用价值。为了说明数据挖掘算法的选择过程,现在以保险数据分析为背景,讨论数据挖掘算法选择的一般方法。