计算机系统平台
上QQ阅读APP看书,第一时间看更新

3.2.1 ASCII字符集及其编码

ASCII(American Standard Code for Information Interchange,美国信息交换标准代码)码是基于拉丁字母的一套字符编码系统。它是现今最通用的单字节编码系统,并等同于国际标准ISO/IEC 646。

ASCII字符集主要包括控制字符(回车键、退格、换行键等)和可显示字符(英文大小写字符、阿拉伯数字和西文符号)。

ASCII编码指的就是将ASCII字符集转换为计算机可以识别的二进制数的规则。使用7位(bits表示一个字符,共128字符。但是7位编码的字符集只能支持128个字符,为了表示更多的欧洲常用字符,对ASCII字符集进行了扩展。ASCII扩展字符集使用8位表示一个字符,共256字符。ASCII字符集映射到数字编码规则如图3-1所示。

图3-1 ASCII编码表

ASCII编码的最大缺点是只能显示26个基本拉丁字母、阿拉伯数字和英式标点符号,因此只能用于显示现代美国英语,而且在处理英语当中的外来词如naïve、café、élite等时,所有重音符号都不得不去掉,即使这样做会违反拼写规则。而EASCII(ASCII扩充编码)虽然解决了部分西欧语言的显示问题,但对更多其他语言依然无能为力。