3.1 连接到文件
Tableau Desktop支持各种数据源类型,包括Microsoft Excel文件、SQL数据库、逗号分隔文本文件和多维数据集(多维)数据库等。
3.1.1 Excel文件
Microsoft Excel是微软办公套装软件的一个重要组成部分,可以进行各种数据处理、统计分析和辅助决策操作,广泛应用于管理、统计财经、金融等众多领域,主要有Excel 2013、2010、2007和2003等版本。
Tableau可以连接到.xls和xlsx文件。在开始页面的“连接”下单击Excel,选择要连接的Excel工作簿,然后单击“打开”按钮,如图3-1所示。
图3-1 选择要连接的Excel工作簿
例如,我们要打开本地电脑上的Superstore Subset.xlsx数据源,首先单击“连接”下的Excel按钮,然后选择数据源的路径,如图3-2所示。
图3-2 选择数据源的路径
设置数据源后,如果Tableau检测到子表、唯一格式设置或数据源包含某些无关信息,就会提示“使用数据解释器”。数据解释器会检测这些子表,以便独立于其他数据使用数据的子集,还可以移除无关信息。选择Superstore Subset.xlsx,单击“打开”按钮,如图3-3所示。
Superstore Subset.xlsx中共有Orders、Returns和Users三张表,我们可以根据需要打开。如果需要打开Orders,将其拖到右侧上方指定位置(画布)即可,如图3-4所示。
图3-3 打开Excel工作簿文件
图3-4 拖动Orders到窗口右侧上方
3.1.2 文本文件
文本文件是指以ASCII码方式(文本方式)存储的文件。更确切地说,英文、数字等字符存储的是ASCII码,而汉字存储的是机内码。通常在文本文件最后一行后放置文件结束标志。
在“连接”页面上单击“文本文件”,选择要连接到的文件,然后单击“打开”按钮,如图3-5所示。
图3-5 选择要连接的文本文件
例如,我们要打开本地电脑上的Bank Response.txt数据源,首先单击“连接”下的“文本文件”按钮,选择数据源的路径,如图3-6所示。
图3-6 选择文本文件的路径
然后选择Bank Response.txt,单击“打开”按钮,如图3-7所示。
图3-7 打开文本文件
3.1.3 Access
Microsoft Office Access是微软把数据库引擎的图形用户界面和软件开发工具结合在一起的数据库管理系统。Access是微软Office的一个成员,在包括专业版和更高版本的Office版本里被单独出售,最大的优点是易学,非计算机专业的人员也能学会。
将Tableau连接到Microsoft Access文件(*.mdb、*.accdb)并设置数据源。Tableau支持除OLE对象和超链接之外的所有Access数据类型。
在开始页面的“连接”下单击Access,如图3-8所示。
通过文件名后的“浏览”按钮选择要连接的Access文件,然后单击“确定”按钮。
如果Access文件受密码保护,就选择“数据库密码”,然后输入密码。如果Access文件受工作组安全性保护,就选择“工作组安全性”,然后在对应文本字段中输入工作组信息文件名、用户和密码,如图3-9所示。
图3-8 选择要连接的Access文件
图3-9 连接Access文件服务器
在数据源页面执行下列操作:
单击页面顶部的默认数据源名称,然后输入在Tableau中使用的唯一数据源名称,默认名称基于文件名自动生成。
单击需要打开的Access文件名称,如Coffee Chain,如图3-10所示。
图3-10 选择Access文件路径
单击“打开”按钮,可以看到多张表,我们选择Product表,如图3-11所示。
图3-11 打开Access文件
3.1.4 JSON文件
Tableau 10.0新增了对JSON文件的支持。JSON是一种轻量级的数据交换格式,适合服务器与JavaScript的交互,具有读写更加容易、易于机器的解析和生成、支持Java等多种语言的特点。
在“连接”页面单击“JSON文件”,选择要连接的文件,然后单击“打开”按钮,如图3-12所示。
图3-12 选择要连接的JSON文件
例如,数据usagov bitly的格式为JSON,在“连接”下单击“JSON文件”,选择数据源的路径,然后选择usagov bitly文件,如图3-13所示。
图3-13 选择文本文件的路径
单击“打开”按钮,出现“选择架构级别”,确定后期用于分析的维度和度量,如图3-14所示。
单击“确定”按钮,完成usagov bitly文件的导入,如图3-15所示。
图3-14 选择架构级别
图3-15 完成usagov bitly文件的导入
3.1.5 统计文件
统计文件是SAS、SPSS和R等统计软件导出的数据文件。在日常统计分析中,我们可能需要经常转换数据源,这就需要分析软件具有兼容性。
Tableau可连接到SAS(*.sas7bdat)、SPSS(*.sav)和R(*.rdata、*.rda)数据文件。在开始页面的“连接”下单击“统计文件”,选择要连接的文件,然后单击“打开”按钮,如图3-16所示。
图3-16 选择要连接的统计文件
例如,要打开Bank Customer.sas7bdat,单击“统计文件”,选择SAS文件,如图3-17所示。
图3-17 选择SAS文件的路径
然后单击“打开”按钮,Bank Customer.sas7bdat的数据如图3-18所示。
图3-18 打开SAS文件
3.1.6 其他文件
其他文件包括Tableau可以识别的数据提取文件和Tableau工作簿。在开始页面的“连接”下单击“更多…”,如图3-19所示。
在“打开”对话框中选择一个特定文件(注:默认打开的位置是“我的文档”下的“我的Tableau存储库”中的“工作簿”文件夹),如网站流量分析.twbx,单击“打开”按钮,如图3-20所示。
图3-19 选择要连接的其他文件
图3-20 选择其他文件的路径