1.2.3 信息编码
计算机不仅可以处理数值信息,也可以处理字符、符号、图形、图像、音频和视频等非数值数据。由于计算机只能识别、存储和处理二进制数据,因此必须将各类非数值数据转换成相应的二进制数据。
1.编码
计算机要处理的数据除了数值数据以外,还有各类字符、符号、图形、图像、音频和视频等非数值数据。利用计算机处理这些信息时,必须首先将其转换成“0”和“1”表示的代码,这一过程称为编码。
2.ASCII编码
ASCII编码是由美国国家标准委员会制定的一种包括数字、字母、通用符号和控制符号在内的字符编码集。ASCII码是一种7位二进制编码,能表示27=128种国际上最通用的西文字符,是目前计算机中,特别是微型计算机中使用最普遍的字符编码集。表1-1所示为ASCII码表。
表1-1 ASCII码表
ASCII编码包括4类最常用的字符。
(1)数字“0”~“9”。
(2)26个英文字母。大写字母“A”~“Z”,小写字母“a”~“z”。
(3)常用字符。如“+”、“*”和“/”等共32个。
(4)控制符。其中包括回车控制符等共34个控制符。
ASCII码采用7位编码,存储时占用一个字节,也就是由8个比特构成,其中最高位为0,其余七位为ASCII码值。
3.汉字编码
国家标准汉字编码集(GB/T2312—1980)共收集和定义了7445个基本字符。按照使用频度将汉字划分为一级汉字和二级汉字。其中,使用频度较高的3755个汉字为一级汉字,使用频度较低的3008个汉字为二级汉字。
GB/T2312—1980规定汉字采用双字节编码,每个字节最高位为0,其余7位用于表示汉字信息。计算机内部使用的汉字机内码标准方案将汉字国标码两个字节的最高位设置为1,从而得到对应的汉字机内码。
4.声音的表示
声音是一种连续变化的模拟量。为了便于计算机加工、处理和存储,可以利用模数转换器对声音信号按固定的时间进行采样,从而得到数字化声音文件。
采样频率越高、量化精度越高、声道数越多,所得到的声音越逼真。为了方便存储和传输,通常对数字化声音进行压缩。
5.图像的表示
通过取样与量化过程将图像变换成便于计算机处理的数字形式,称为图像数字化。通常,图像在计算机内用一个数字矩阵表示,矩阵中的每一个元素称为像素。在计算机中使用若干比特位描述图像中的每个像素点。为了方便存储和传输,通常对数字化图像进行压缩。