大话数据科学:大数据与机器学习实战(基于R语言)
上QQ阅读APP看书,第一时间看更新

2.2 R语言介绍

R语言是一种程序语言,其应用面向数据处理、统计分析、数据挖掘、机器学习、数据可视化。R语言的特点是功能强大、源代码开放、共享平台免费。R语言提供一万个以上的软件包,(package)是函数、数据集和编译程序等的集合。

2.2.1 安装R语言软件

首先,下载R语言软件:

(1)进入网站www.r-project.org。

(2)在R主页左上角 Download下单击CRAN。

(3)CRAN链接,选择一个镜像Mirrors链接地址,如中国的清华大学。

https://mirrors.tuna.tsinghua.edu.cn/CRAN/。

(4)选择Download R for Linux、Download R for Mac或Download R for Windows。

(5)如果选择Download R for Windows,单击base基础包。

(6)下载执行文件,单击Download R 3.5.3 for Windows。

(7)安装 R语言软件。

(8)启动R,出现R的提示符 >,开始R的命令内容。

(9)R的#表示说明文件批注,程序不会执行。

(10)一行多个表达式可以用;隔开,一个表达式可分成多行。

(11)+号表示尚未输入完成,接续上一个命令,可按Esc键离开。

(12)↑键可自动重复上一个命令,如果打错一个命令行,可以此修改。

(13)对象(数据)名称是英数字加底线或句点,第一个字是英文,大小写有差异。

(14)创建对象用 <-或=号,以()括住命令直接显示数据,NA表示遗失值。

(15)档案路径可写成 “c:/R/babies.txt”或“c:\\R\\babies.txt”。

2.2.2 下载R语言程序包

在2.2.1节第7步安装 R语言,用桌面捷径 R x64 3.5.3启动R。

     > install.packages("arules")

如图2-1所示,选择一个镜像链接(右边5个在other mirrors)。

图2-1 选择镜像链接

install. packages(“包”)→ library(包)→ 函数(数据,method =方法,参数)。

install.packages(“包”)只要在第一次安装,以后每次要用library(包)。

函数(Function)有自定义函数和调用函数,请见表2-3,例如:

     > dis<- dist(data,method = "euclidean");hc <- hclust(dis,method=
   "complete")