Python大数据分析算法与实例
上QQ阅读APP看书,第一时间看更新

3.4 数据类型

1.NumPy数据类型

NumPy支持比Python更多种类的数据类型。表3.1定义了不同标量的数据类型。

表3.1 不同标量的数据类型

NumPy数值类型是dtype(数据类型)对象的实例,每个对象具有唯一的特征。这些类型可以是np.bool_、np.float32等。

2.数据类型对象(dtype)

数据类型对象描述了对应于数组的固定内存块的解释,取决于以下5个方面:

  •  数据类型(整数、浮点数或者Python对象)。
  •  数据大小。
  •  字节序(小端或大端)。
  •  在结构化类型的情况下,字段的名称、每个字段的数据类型和每个字段占用的内存块部分。
  •  数据类型是子序列的形状和数据类型。

字节顺序取决于数据类型的前缀“<”或“>”。<意味着编码是小端(最小有效字节存储在最小地址中),>意味着编码是大端(最大有效字节存储在最小地址中)。

dtype可由以下语法构造:

numpy.dtype(object, align, copy)

参数说明如下:

  •  object:被转换为数据类型的对象。
  •  align:如果为true,就向字段添加间隔,使其类似C的结构体。
  •  copy:生成dtype对象的新副本,如果为false,结果就是内建数据类型对象的引用。

【例3.5】

# 使用数组标量类型
import numpy as np
dt = np.dtype(np.int32)
print dt

输出如下:

int32

【例3.6】

# 首先创建结构化数据类型
import numpy as np
dt = np.dtype([('age',np.int8)])
print dt

输出如下:

[('age', 'i1')]

【例3.7】

# 现在将其应用于 ndarray 对象
import numpy as np
dt = np.dtype([('age',np.int8)])
a = np.array([(10,),(20,),(30,)], dtype = dt)
print a

输出如下:

[(10,) (20,) (30,)]

每个内建类型都有一个唯一定义它的字符代码:

  •  'b':布尔值。
  •  'i':符号整数。
  •  'u':无符号整数。
  •  'f':浮点数。
  •  'c':复数浮点数。
  •  'm':时间间隔。
  •  'M':日期时间。
  •  'O':Python对象。
  •  'S', 'a':字节串。
  •  'U':Unicode。
  •  'V':原始数据(void)。