数据挖掘实用案例分析
上QQ阅读APP看书,第一时间看更新

第3章 常用可视化的多维分析

在数据分析中,通过各种可视化的图形,从多个维度、多个层次展示企业商务的执行情况,发现可能存在的问题或潜在的危机,并预测未来业务发展的趋势,具有重要的价值。而且利用可视化的工具,也可以发现数据的一些质量问题、分布特点,可以为进一步的数据挖掘做预处理。因此,结合业务理解,利用常用的可视化工具,如Tableau、Lumira、国内的永洪大数据分析工具Yonghong Z-Suite等,对数据做一定深度的分析,这是数据分析师的基本功。

可视化图形通过位置、长、宽、角度、大小、色调、形状等多个方面,以视觉效果来表达图形相关含义。在数据分析中,各种不同的图形具有各异的作用,这也就为解决多元问题,深层次了解业务逻辑提供了方法途径。

可视化图形的作用各异,箱图的作用是展现数据的离散状态,以其数据节点:上限、下限、上四分位、下四分位、中位数及异常值为依据,来分析数据的离散程度等信息,可应用于数据预处理,识别数据异常值及分析数据离散状态。雷达图的作用是对事物的不同维度进行分析研究(通常,维度应大于或等于四维),通过网状结构的图形对比形象展示各维度属性的相关状态。标签云的作用是显示词频,将标签出现或者被引用的多少,通过标签字体的大小和颜色等视觉效果呈现出来。气泡图的作用是研究数据之间的关系,以气泡的位置和大小及颜色来表现变量之间的关联。树图的作用是展现数据的层次关系,通过树图区域模块的占比、颜色深浅及层次等信息来研究数据之间的逻辑结构关系。地图的作用是展示数据与地理位置之间的关系,同时,可以根据颜色的深浅来判断地理区域或关键词的热门程度。高低图的作用是展现数据的波动特性,其不仅能研究数据长期波动的特性,也能研究数据短期的波动特性。双轴图的作用是展现数据的波动特征以及其数据之间的关联,通过在同一分析图形中绘制不同类别的图形,形象地展示数据之间的关系。关系图的作用是展现事物之间的相关性及其逻辑结构,以事物之间连线的粗细和颜色深浅等视觉效果为依据,研究事物之间复杂的逻辑关系。热图的作用是表现数据的热点特征,以视觉化的区域和色彩来表现数据的热点程度等特征。

在种类繁多的分析图形中,需要根据研究问题的不同,选取适当的分析图形来进行数据分析。下面对常用的分析图形作简要介绍。