1.2 什么是数据可视化
1.2.1 数据可视化的概念
数据可视化旨在借助图形化手段,来清晰、有效地传达信息。数据可视化为了达到上述目的,需在数据满足分析决策需要和数据展现形式上同时予以考虑,通过直观地传达关键数据与特征,实现对于相当分数而又复杂的数据集的深入洞察。然而,现实中,设计人员往往并不能很好地把握设计与功能之间的平衡,从而创造出华而不实的数据可视化形式,无法达到其主要目的,也就是传达与沟通不畅。
数据可视化与信息图形、信息可视化、科学可视化以及统计图形密切相关。当前,在研究、教学和开发领域,数据可视化是一个极为活跃而又重要的领域。
1.2.2 商务智能与数据可视化的关系
商务智能的目标是将商业和企业运维中收集的数据转化为知识,辅助决策者做出明智的业务经营决策。数据包括来自业务系统的订单、库存、交易账目、客户和供应商等,以及其他外部环境中的各种数据。从技术层面上看,商务智能是数据仓库、联机分析处理工具和数据挖掘等技术的综合应用,其目的是使各级决策者获得知识、提升洞察力。为了使分析后的数据直观、简练地呈现在用户面前,则需要采用一定的形式表示和发布出来,此时便需要应用数据可视化技术。
商务智能中的数据可视化,是以商业报表、关键绩效指标、图形等易为人们所辨识的方式将原始数据间的复杂关系、潜在信息以及发展趋势,通过可视化展现平台,以易于访问和交互的方式来揭示数据的价值,从而提升决策人员的业务过程洞察力。目前,多数商务智能软件企业已提供了基于Web应用的展现服务,来扩展商务智能的信息发布范围。另外,随着移动应用的普及和移动办公的需求日益强烈,部分主流商务智能软件企业也有了移动端平台展现可视化开发的业务,例如微策略(MicroStrategy)。下面介绍两个在商务智能数据可视化中常用的两种展现形式,即仪表盘和平衡计分卡。
1.仪表盘
仪表盘(Dashboard)在商务智能分析中起着很重要的直观展示数据与支持决策的作用。由于仪表盘是一个商务智能综合分析展示的平台,所以一个界面上可能会有多个组件和图表,但这并不意味着这些数据和图表组件是随意堆砌的。商务智能仪表盘的展示大多有一个特定的主题或分类。大致归纳为3种:运营仪表盘、策略仪表盘和战略仪表盘。根据种类的不同,仪表盘的设计及展示也大不相同。
商务智能仪表盘也可以被称为管理驾驶舱,无论是管理决策者,还是企业业务流程中的普通员工,都可以利用它来展示聚合分析的结果,让决策更加快速、准确,进而更快地推进业务流程,最终提高工作效率。
2.平衡计分卡
平衡计分卡(Balanced Score Card)是商务智能分析中另一个主要应用数据可视化技术的部分。1992年,Robert Kaplan及David Norton在《Harvard Business Review》(哈佛商业评论)中发表题为“The Balanced Score Card:Measures That Drive Performance”的文章(平衡计分卡:驱动绩效的度量)。这是第一次提出平衡计分卡的概念。
平衡计分卡主要是通过图、卡、表来实现战略的规划。此工具可以将企业的策略,透过财务、内部业务流程、学习与成长、客户这4个方面来审视,如图1-4所示。每一方面都包括了策略目标、行动计划及衡量指标这三大部分。所谓“平衡”,是从3个角度来观察:一是外部及内部间的平衡,外部强调财务方面及客户方面,内部则强调内部流程及学习与成长方面;二是财务及非财务方面衡量的平衡;三是领先指标及落后指标的平衡等。
图1-4 平衡计分卡视角图
1.2.3 常见图表概览
通常业务分析系统的终端用户在面对特定目标时,并不很确定应该使用何种类型图表。某些图表能够更好地解答特定的问题。下面简单介绍业务分析系统中常见的图表,并分别说明它们能够更好地解决或分析什么问题。有人觉得,基本图表太简单、太原始,不高端、不大气,因此追求更复杂的图表。这是对图表的一种误解。其实越简单的图表,越容易理解。快速、简洁地表现数据是“数据可视化”的最重要目的和最高的追求。
1.基本图表
下面介绍数据可视化中最常用的基本图表。
(1)折线图(Line Chart),是最常用于描述时间序列数据的图表,如图1-5所示。折线图表示两种变量之间的关系,常用于追踪在一个时间段内的趋势或变化(通常将时间设为X轴)。折线图将图表中的各个数据点依次连接起来,帮助发现一段时间内的变化趋势。折线图常用于显示随时变化的度量,例如,某股票5年内的价格改变,企业1个月内每天客服呼叫数量的变化。
图1-5 折线图
(2)柱状图(Bar Chart),是最基本的数据表示图形之一,如图1-6所示。当具有能精确地划分成不同类别的标称(nominal)型数据或数据型数据时,用柱状图可以快速地比较数据的结果和趋势。柱状图常用于比较不同类别的数据,例如各个部门的或产品类别的广告支出百分比。柱状图可以横向的,也可以是纵向的,还可以进行堆积,可在一张图上显示多个维度。
图1-6 柱状图
(3)饼图(Pie Chart),是一种圆饼状的图,如图1-7所示,常用于显示特定度量的相对百分比。例如,饼图可以用于展示不同产品的广告预算百分比,或者大二学生所学专业的相对比例等。但如果数据类别过多(大于4类),那么可以考虑使用柱状图来代替饼图。
图1-7 饼图
(4)散点图(Scatter Plot),常用于分析两个或者三个变量之间的关系(二维或三维图),如图1-8所示。如果应用于3个以上变量,则散点图层变得难以操作。散点图在探究数据趋势、集中度和异常值等方面十分有效。例如,用户可以使用两个变量的散点图,展示心脏病患者年龄与体重之间的关系;或者显示客户服务代表数量和客户服务请求数之间的关系。通常,在二维散点图中叠加(superimpose)趋势线,显示数据之间的关系。
图1-8 散点图
(5)气泡图(Bubble Chart),是散点图的强化版本,可以看作是在散点图(或者地图)中增强数据表现力的一种技术。通过改变气泡的大小和颜色,用户可以加入新的数据维度,表达数据更丰富的内涵,如图1-9所示。例如,气泡图可以按照不同产品和销售地区显示利润率(Profit margin)。
图1-9 气泡图
2.专业图表
专业图表是从基本图表的特例衍生出来的,用于解决特定领域或特定问题的图表。
(1)直方图(Histogram),直方图和柱状图从图形上来看很相似,二者不同之处在于对信息的描述。直方图用于表示一个或多个变量的取值频率分布情况。在直方图中,X轴通常用来代表类别或者区间,而Y轴通常表示度量、数值或频率。直方图能够展现数据的分布形状,从而帮助用户判断数据是呈正态分布还是指数分布。例如,直方图可以显示一个班级的考试成绩,包含分数的分布状况和单个学生之间的分数比较;或者用来展现客户群的年龄分布。
(2)甘特图(Gantt Chart),是一种特殊的横向条形图,用于描述项目时间表、项目任务或活动时间段和项目活动之间的重叠情况。通过显示项目中任务的开始和结束时间(日期)以及重叠情况,甘特图对项目管理和项目控制有很高的价值。例如,甘特图通常用于展示项目时间表、任务重叠、相对任务完成度(在局部的条形柱中用完成百分比表示任务的进度)、各任务分配的资源、里程碑和成果。
(3)计划评审技术图(PERT Chart),又叫作网络图,主要用于简化大型复杂项目的计划与调度,可显示项目任务之间的次序关系。计划评审技术图由结点(圆形或长方形)和边(有箭头)组成。根据用户不同的使用习惯,项目的任务可以用结点表示,也可以用边来表示。
(4)地图(Map Chart),通常用于展现数据集中任何形式的位置数据(如实际地址、邮政编码、国家或地区名、经纬度以及一些形式的客户地理编码)。地图通常不会单独使用,而是与其他的图表结合使用。例如,根据产品类型(用饼图描绘)和地理位置用地图来展示客服请求的分布情况。用户通常可以用地图来展现大量各种类型的数据(例如年龄分布、收入分布、教育、经济成长或人口变化等),从而决定在什么地方开设新的餐厅或服务站。
(5)子弹图(Bullet Chart),通常用于展示既定目标的完成进度。子弹图本质上是条形图的一种衍生品。在大部分情况下,子弹图用在各个仪表盘和温度计上,使用较少的空间来直观地表达信息。子弹图将一个主要指标(如从年初至今的收入)和多个其他指标(如年收入目标)进行比较,并使用预定义的绩效度量进行表示(如销售配额)。子弹图可以直观地显示主要指标和目标之间的差距(例如,一个销售人员目前的销售数量与他的年销售配额相差多远)。
(6)热图(Heat Map Chart),是一种非常有效的可视化工具,使用颜色来表示两种类别的连续值之间的比较。热图的目的是帮助用户快速地发现目标差异:就分析的数值度量而言,两个类别相交的部分在哪些部分最强,哪些部分最弱。例如,用户可以使用热图进行目标市场的分割分析,其中,度量用颜色梯度代表购买数量,维度为收入分布和年龄。
(7)突出显示表(Highlight Table),是热图进一步改进的形式。除了使用颜色来表示数据交叉外,突出显示表中还添加了数字来显示更多信息。也就是说,突出显示表是二维表格,其中单元格里包含数值和颜色梯度。例如,突出显示表可以根据各类产品的销售量说明销售人员的绩效。
(8)树状图(Tree Map Chart),使用多个嵌套的矩形来展示层次(树状结构)数据。这个树状结构中,树的每一个分支都是一个矩形,下面有更小的矩形代表子分支;叶子结点的矩形面积大小与数据的维度成比例。通常叶子结点带有颜色,用以显示数据的不同维度。树状图对空间的利用率很高。因此,树状图可以在屏幕上同时显示成千上万个结点。
上述的图表基本涵盖了数据可视化领域的常用图表,但实际应用的图表还不止这些。目前,有很多用于特定用途的图表,而且图表的应用趋势是混合这些图表,并使用动画展示,更加美观、直观地表达复杂多变的业务数据。例如,在Gapminder网站可以发现很多可交互的、动态的气泡图,其中提供了从多个视角展示的健康、财富和人口数据。