前言
大数据是当今社会炙手可热的话题,与之相关的专业词汇常被人提起,用于描述信息爆炸时代的海量数据。数据展示了人们的逻辑思维,而人的创造力更贴近于形象思维,将海量的数据变为人们可以明白的图像,能更加方便人们理解信息与事物之间的规律,于是诞生了图像思维中的图像视觉符号来统计海量数据。在此期间,可视化的关键技术在不断前进并在重大科学工程中发挥着巨大作用。
数据可视化包括相应数据的各种属性和变量,拥有的技术方法包括图形、图像处理、计算机视觉及用户界面。通过表达、建模,以及对立体、表面属性和动画的显示,数据可视化对海量的数据加以可视化解释。常规的可视化方法有直方图、散点图、多边形图、饼图、面积图、流程图、气泡图、箱形图等,多个数据系列或图的组合有时间线、维恩图、数据流程图、实体关系图等。此外,还有一些与以前的方法不同的数据可视化方法,如平行坐标、树、锥树和语义网络等。
当然,在传统的数据挖掘技术应用过程中,数据可视化也起到了很大的作用,但是用户在挖掘过程中是无法观察到数据挖掘的过程的,只能获取结果,所以,在数据分析与挖掘的过程中使用者并不能直观地获取观察过程,往往会导致用户更加单一地分析数据挖掘结果;而可视化数据挖掘为用户提供直观的信息数据,便于用户交互流量数据,从而极大程度地提升了数据挖掘的效率、准确性、有效性,获得更有使用分析价值的数据结果。所谓可视化,是指人们借助视觉观察在思维中形成客观事物影像的过程。这是一种心智处理的过程,可视化能够提升人们对事物观察的准确性,并形成一个完整的整体概念。可视化结果便于人们理解和记忆,并且它对信息的表达方式、处理方式是其他方式无法替代的。可视化技术普遍将人们所习惯的图形、图像工具融入信息处理技术中,将大量的信息化数据以更加直观的方式让人们理解和接受,将大量数据通过仿真化、形象化、模拟化等全新技术方式重现出来。可视化不仅可以通过客观的理念展现数据内容,还可以为使用者提供更加规律、真实的数据信息。
数据可视化技术可以大大加快数据的处理速度,使得每时每刻都在产生的庞大数据得到有效的利用,实现人与人和人与机之间的图像通信,改变了目前的文字和数字通信,从而使人们能够观察到传统方法难以观察到的规律,使科学家不仅能得到计算结果,还能知道在计算过程中发生了什么现象,并可改变参数,观察其影响,对计算过程实现引导和控制。用户也可以方便地以交互的方式管理和开发数据,使得人工处理数据、绘图仪输出二维图形等传统方法一去不复返。
关于本书
本书共分为8章:福建技术师范学院的倪振松负责全书的统稿工作,第1、2章由中国联通浙江省分公司的胡煜华编写,第3~5章由广西自然资源职业技术学院的朱家全编写,第6、7章由广州市财经商贸职业学校的谢岳富编写,第8章由福州德明科技有限公司的陈建平编写。
第1章着重介绍大数据的发展历程,以及在大数据发展背景下数据可视化的概念、可视化技术的使用及可视化的现实意义;第2章着重介绍如何通过Excel工具实现数据可视化的内容;第3章着重介绍Tableau可视化工具的使用、数据处理、数据可视化的应用等内容;第4章着重介绍以Highcharts、d3可视化为主要内容的Web可视化组件;第5章着重介绍以JFreeChart和ECharts为代表的Java可视化控件的安装、功能及使用案例;第6章着重介绍以Python编程为基础的数据可视化工具,包括Matplotlib框架、Bokeh框架、Pairplot框架及以ECharts为基础发展起来的Pyecharts框架;第7章手动实操豆瓣电影数据可视化应用案例;第8章手动实操餐饮数据可视化应用案例。
本书适合的读者
本书是大数据背景下的可视化开发技术教材,适用于具有编程基础和数据可视化基础的初学者、使用过界面可视化工具的应用人员、可视化编程的开发人员及高校大数据相关专业的师生等。
配套资源下载
本书配套资源包括教学大纲、实验手册、案例代码、PPT课件、教学视频、习题和答案、实验配套镜像,需要用微信扫描下边二维码获取。
倪振松
2023年8月