大数据分析与应用实战:统计机器学习之数据导向编程
上QQ阅读APP看书,第一时间看更新

1.1.3 贡献套件

第三种情形是我们想使用贡献套件{nutshell}中的数据集team.batting.00to08,因为贡献套件的数量最多,所以我们示范使用者经常遇到的错误情形,第一种错误是直接使用data()调用team.batting.00to08数据集,或使用str()查看其数据结构,均出现警告或错误信息,显示内存中并无数据对象team.batting.00to08。

上面两行指令前面均加上程序代码批注符号#,这是因为错误的代码会中断Latex+R与Latex+Python的编译,所以将其标注为不执行,并在后方附上执行所得的警告或错误信息。另外一种必须标记的情形是程序代码执行后,结果会出现在浏览器窗口中,因而将之标记起来,以上情况请读者自行演练查看相关结果(参见1.2节环境与辅助说明部分)。

另一种错误是欲加载数据集隶属的{nutshell}套件到内存后,再使用team.batting.00to08数据对象,但发现library(nutshell)亦回报并无套件{nutshell}的错误信息。

回顾前面套件管理与使用的两步骤(见图1.1),我们发现以上错误是因为第一、二步均未完成。所以正确的做法还是要先检查搜索路径(内存)中是否有{nutshell}套件,如果没有,则再检查本机硬盘中是否已安装{nutshell}套件。

安装套件与加载内存后,可顺利地加载team.batting.00to08数据集。

所以贡献套件的结论是在安装R时并未从云端下载到本机硬盘,所以启动R对话时当然也无从加载到内存中,用户必须完成两步后方能使用该套件下的数据、函数与说明文件。

本机硬盘与内存的套件查核,也可通过RStudio右下角Package页签窗格(pane)的放大镜搜索本机硬盘套件以及是否已勾选复选框(check box),来确认是否已加载内存。读者请留意网络上或课程中所附的程序代码,通常只有每次对话均须加载内存的library("xxx")指令,不会有仅需下载到硬盘一次的install.packages("xxx")指令。Python代码同样也只有import,缺少套件时请自行通过pip install xxx安装。因此,本书后续也假设读者已预先安装好所需的R或Python套件。