数据分析与挖掘:R语言
上QQ阅读APP看本书,新人免费读10天
设备和账号都新为新人

第1章 R语言简介

R语言是集统计计算和绘图功能于一体的语言环境,是由来自新西兰奥克兰大学的Ross Ihaka和Robert Gentleman于1993年开发的,其前身是贝尔实验室(Bell Laboratory)所创的S语言。作为一个共享的开源平台,R由一个庞大且活跃的全球性研究型社区维护。R具有下列优势。

(1)可进行统计分析。R不仅拥有几乎所有的经典统计方法,而且拥有众多前沿的现代统计模型、数据挖掘算法等,几乎任何数据分析过程都可以在R中完成。与SPSS、MATLAB等数据分析软件相比,它显得简单很多。

(2)具有强大的绘图功能。尤其对于复杂数据的可视化问题,R的优势更加明显。一方面,通过R中各种绘图函数和绘图参数的综合使用,可以得到各式各样的图形结果;另一方面,从进行数值计算到得到图形结果的过程很灵活,一旦写好程序,如果需要修改数据或调整图形,只需要修改几个参数或直接替换原始数据即可,不用重复劳动。

(3)作为一个免费的数据分析软件,R已发展成可运行于Windows、mac OS和Linux等操作系统,支持交互式数据探索和分析实践,支撑统计理论研究和探讨的强大平台。

(4)R可以轻松地从多个数据源导入数据,包括文本文件、数据库、其他统计软件等,它同样可以将数据输出并写到这些系统中。

(5)具有较高的开放性。R不仅提供功能丰富的内置函数供用户调用,而且提供平台让用户将自己所写的包放在R的主页上与他人共享,以开发者的身份参与其中。

R是一个体系庞大的应用软件,主要包括核心的R标准包和各专业领域的其他包。本章主要对R的安装,一些与数据分析和挖掘相关的包,以及常用函数的使用进行简单介绍。