1.3 数据可视化简介
本节主要对数据可视化进行介绍。
1.3.1 数据可视化的概念与分类
人类的创造性不仅取决于人类的逻辑思维,还取决于人类的形象思维。将数据映射为视觉符号,充分利用人们的杰出视觉来获取大数据中蕴含的信息。只有将大数据变成形象可视化之后才能激发人的形象思维与想象力。由于数据可视化的范围不断扩大,导致数据可视化成为一个不断发展与动态变化的概念。
数据可视化包括3种类型:科学可视化、信息可视化和数据可视化。
· 科学可视化是解释大量数据的最有效手段,因而首先应用在科学与工程计算领域中,并发展为科学可视化的研究领域。其主要过程是建模和渲染。
· 信息可视化是跨学科领域的大规模非数值型信息资源的视觉展现,帮助人们理解和分析数据。信息可视化致力于创建以直观方式传达抽象信息的手段和方法。
· 数据可视化是关于数据的视觉表现形式的研究。将大型数据集中的数据以图形图像形式表示,主要借助图形化手段,清晰有效地传达与沟通信息。
1.3.2 数据信息的展示方式
数据显示是将系统内部或外部存储器中的数据以可见或可读的形式进行输出,包括数据值直接显示、数据表显示、各种统计图形显示等形式。在地理信息系统中,反映空间信息的数据还能以图形或图像的形式显示。数据显示除与数据本身有关外,还与显示设备有关。对于高分辨彩色显示器、彩色绘图机等,不仅显示精度高,还可利用不同颜色表示不同数值。对于单色显示器、打印机等,需设计不同显示符号来表示不同数值,以增强显示效果。
1.列表
将实验数据按一定规律用列表方式表达出来是记录和处理实验视觉最常用的方法。表格的设计要求对应关系清楚、简单明了、有利于发现相关量之间的物理关系,实验数据统计表格示例如图1-5所示,根据实际需求还可以列出除原始数据外的计算栏目和统计栏目等。
图1-5 实验数据
2.作图
作图法可以直观地表达物理量之间的变化关系。从图线上还可以简单快速地计算出实验需要的某些结果,如直线的斜率和截距值等,读出没有进行观测的对应点(内插法),或在一定条件下从图线的延伸部分读取到测量范围以外的对应点(外推法),如图1-6所示。
图1-6 作图法
3.图表
(1)直方图
直方图是将一个变量的不同等级的相对频数用矩形块标绘的图表。直方图又称柱形图、质量分布图,是一种统计报告图。直方图中一系列高度不等的纵向条纹或线段表示数据分布的情况,如图1-7所示。
图1-7 直方图
(2)散点图
散点图表示因变量随自变量变化的大致趋势,据此可以选择合适的函数对数据点进行拟合,如图1-8所示。
图1-8 散点图