2.6 大数据可视化技术
在大数据分析的应用过程中,可视化通过交互式视觉表现的方式来帮助人们探索和理解复杂的数据。可视化与可视分析能够迅速和有效地简化与提炼数据流,帮助用户交互筛选大量的数据,有助于用户更快、更好地从复杂数据中得到新的发现,是用户了解复杂数据、开展深入分析不可或缺的手段。大规模数据的可视化主要是基于并行算法设计的技术,合理利用有限的计算资源,高效地处理和分析特定数据集的特性。
2.6.1 Tableau
Tableau是用于可视分析数据的商业智能工具。用户可以创建和分发交互式和可共享的仪表板,以图形和图表的形式描绘数据的趋势、变化和密度。Tableau可以连接到文件、关系数据源和大数据源来获取和处理数据,允许数据混合和实时协作。Tableau常被企业、学术研究人员和政府部门用来进行视觉数据分析。它还被定位为 Gartner“分析与商业智能分析平台”魔力象限中的领先者象限。
Tableau使用起来非常简单,通过导入数据,结合数据操作,即可实现对数据进行分析,并生成可视化的图表。Tableau 的程序很容易上手,用户可以将大量数据拖放到数字“画布”上,然后就可以生成各种图表。界面上的数据容易操控,通过数据可视化展示,用户可以清楚地了解决策正确与否。Tableau分为Desktop版和Server版。Desktop版又分为个人版和专业版,个人版只能连接到本地数据源,专业版还可以连接到服务器上的数据库。Server版主要用来处理仪表盘,上传仪表盘数据,并进行共享,其他用户通过访问同一个Server就可以看到相应的数据信息。
简单、易用是Tableau最大的特点,使用者不需要精通复杂的编程和统计原理,只需要把数据直接拖放到工作簿中,通过一些简单的设置就可以得到自己想要的数据可视化图形,这意味着每个人都可以自助分析数据。
2.6.2 Google Chart
Google Chart是一项免费服务,最初是谷歌内部用来创建图表所用的。后来谷歌将其开放出来,进行开源共享。Google Chart可以提供完美的数据可视化处理,从简单的折线图到复杂的分级树形图,在它的图表库里有海量模板可供选择。Google Chart可以按需定制,但通常默认样式就能满足用户的所有需求。所有的图表样式都是使用数据库表类来填充数据的,用户可以轻松转换表格类型。同时,谷歌提供了一个专门的图表论坛,在那里用户可以互相帮助、学习和发现,以便使用不同的图表展示不同的信息。
Google Chart API通过URL传递参数,生成动态的图表图片。该API能产生各种各样的图表,如饼图、地图、QR码、文氏图等。所有描述图片的参数都包含在URL中。部分图表的URL可以采用Chart Wizard快捷生成,生成的URL可以嵌入<;img>;标签中,使用起来极其方便。
2.6.3 D3.js
D3.js是一个JavaScript库,它的全称是数据驱动文档。D3.js是一个开源项目,作者是《纽约时报》的工程师,其中提供了各种简单易用的函数,大大降低了JS操作数据的难度,尤其是在数据可视化方面,D3.js 已将生成可视化图形的复杂操作精简到几个简单函数,只需输入几个简单数据,就可生成各种绚丽图形。D3.js采用可缩放矢量图形(SVG)格式,允许渲染可放大或缩小的形状、线条和填充,而不会降低质量。
目前,可视化工具非常多,每种工具都有自己的特点,用户可根据需要选择使用。