精益数据分析:数据驱动商业决策与业务增长
上QQ阅读APP看本书,新人免费读10天
设备和账号都新为新人

1.4 数据分析技术方法

结合业务理解和分析经验,采用一定的数据分析技术方法对数据进行分析,才能获得准确的结果以解决业务问题。业务人员掌握和使用基本的数据分析方法即可。复杂业务场景或复杂数据处理会涉及有一定技术难度的分析技术方法,这类场景中的数据分析通常需要数据专业技能人员参与。数据分析中的各种技术方法仅仅是工具和手段。利用数据分析方法进行业务分析时,关键是将业务逻辑转化为数据逻辑。

数据分析技术方法分为3个层次:描述型统计分析、验证型统计分析和预测型统计分析。描述型统计分析通过数据统计特征、数据表或图形等,对业务中蕴含的数据规律进行量化描述,侧重于展示信息。验证型统计分析是通过分析方法或模型对既定假设进行验证和评估,侧重对数据结论和结果的准确性校验。预测型统计分析是利用模型发现的内在规律对关键数据变量进行预测,该数据变量会影响分析结论。

常见的基本数据技术分析方法包括分组分析法、对比分析法、漏斗分析法、下钻分析法、象限分析法、归因分析法、数学公式分析法等,概要说明如下。

❑ 分组分析法是依据分析对象的某个特征或维度进行分组,对不同组的指标进行分析,比如不同年龄段人群的平均身高数据是依据年龄维度进行分组。分组分析法通常需要结合对比分析法使用。

❑ 使用对比分析法时,要注意纵向和横向维度的比对,比如不同业务的相同指标参考基准等。

❑ 漏斗分析法通常用于链路转化评估分析,通过将业务的重要环节进行串接,分析每个环节的影响和转化情况,可用于互联网用户行为分析。

❑ 下钻分析法其实是对维度层级拆解,拆解到能够定位问题的子维度以进行深入分析。

❑ 象限分析法是将多个数据指标排在一起进行分析,将定量的指标提炼成定性的总结分析,在不同象限上直观反映出来。四象限分析就是典型的象限分析法。

❑ 归因分析法和数学公式分析法的用途较广,它们能够表达出复杂的数据逻辑,可以将各种因素都考虑到,同时每个因子也可以进行下一层级的拆解和表达。

数据分析技术方法中对数据的表达和分析经常会用到数据的统计量特征,比如均值、中位数、众数、标准差、方差、百分位数等,有时还会通过概率分布(比如高斯分布、几何分布、二项分布、泊松分布等)来表达数据中蕴含的规律信息。具有一定技术深度的经典数据分析方法如下。

❑ 抽样分析:主要包括随机抽样、系统抽样和分层抽样。

❑ 相关分析:利用Pearson相关系数分析出两个变量间的关系(包括强度和方向),可用于关联分析和挖掘。通常,Pearson相关系数大于或等于0.8可认为两者高度相关,低于0.3则认为两者不相关。

❑ 主成分分析:利用正交降维,减少特征和数据量,精练地表达数据信息。

❑ 因子分析:利用协方差提取数据中的共性因子。

❑ 聚类分析:通过计算欧式距离,利用聚类算法对数据进行聚类,属于无监督的机器学习方法。

❑ 假设检验:利用卡方检验、正态分布检验来验证两个数据集是否存在显著性差异,也叫显著性检验,用于两种数据的验证分析,比如产品改版前后某个关键指标的变化。

❑ 回归分析:验证数据间是否存在某种线性或非线性规律,并提取出来。

❑ 分类分析:依据数据特征将其分类,获得分类的数学模型,属于有监督的机器学习方法。

可以发现,在上述分析技术方法中,相关分析、假设检验等属于验证型方法,回归分析和分类分析属于预测型分析。不论采用简单的数据分析技术方法,还是采用具有一定技术深度的数据分析技术方法,一定是建立在业务逻辑之上。在数据上能够准确地表达出业务逻辑,才能发现问题并解决问题。