深入浅出Python机器学习
上QQ阅读APP看书,第一时间看更新

2.3.1 Numpy——基础科学计算库

Numpy是一个Python中非常基础的用于进行科学计算的库,它的功能包括高维数组(array)计算、线性代数计算、傅里叶变换以及生产伪随机数等。Numpy对于scikit-learn来说是至关重要的,因为scikit-learn使用Numpy数组形式的数据来进行处理,所以我们需要把数据都转化成Numpy数组的形式,而多维数组(n-dimensional array)也是Numpy的核心功能之一。为了让读者直观了解Numpy数组,下面我们在Python的IDLE中新建一个文件,然后输入几行代码来进行展示:

import numpy
#给变量i赋值为一个数组
i = numpy.array([[520,13,14],[25,9,178]])
#将i打印出来
print("i:\n{}".format(i))

将这三行代码保存成一个py文件,然后在编辑器窗口按F5运行,我们会得到如图2-11所示的结果。

图2-11 一个简单的numpy数组

【结果分析】这里i就是一个典型的Numpy数组,在本书中,我们会大量用到Numpy。后面我们会用“np数组”来指代Numpy数组。

注意 对于零基础的读者来说,先不必纠结Python的IDLE编辑器用法,后面我们会主要使用Jupyter Notebook来进行代码的编写和运行。