科坛无冕之王:数学与高新技术
上QQ阅读APP看本书,新人免费读10天
设备和账号都新为新人

4 编码技术

编码技术是在符号集合与数字系统之间建立对应关系,它是信息处理的一项基本的数学技术。通常人们用符号集合(一般情况下就是文字)来表达信息。而以计算机为基础的信息处理系统则是利用元件(硬件)不同状态的组合来存储和处理信息。元件不同状态的组合能代表数字系统的数字,因此编码就是将符号转换为计算机可以接受的数字系统的数,称为数字代码。例如,数码管有10个状态,分别表示从0到9的10个数字,可以构成一个十进制数来编码:A=01, B=02, …, Z=26,符号集合有26个元素,而两位十进制数字系统有100个元素,其中74个元素没有使用。双稳态元可以构成二进制数字系统,既经济效益又高,便于用集成电路实现,为计算机所采用。

编码的方式很多,但都应当满足下述要求:符号之间的某种关系应当在相应的编码中有所反映。例如,字母表中有个顺序关系:A在B之前,B在C之前等,可对应编码的大小关系:01 <02<03等;作用于符号的操作和对应的作用数的操作能产生相应的效果;表达方式应当是高效率的,能够缩小数字系统的体积,减少浪费。

十进位制数码的符号共有10个,可表示为二进位制数码,如D = b4b3b2b1是十进位制某个1位数,bii = 1,2,3,4)是0或1,可规定4个数W1, W2, W3, W4同b1, b2, b3, b4对应,于是对应规律为

数字字符多,数量大。1980年中国公布了国家标准《汉字交换码基本集》,于1981年5月1日开始执行。标准规定了一般字符、序号、数字、拉丁字母、汉字等7445个图形字符,其中一般符号202个,序号60个,数字22个,拉丁字母52个,日文假名169个,希腊字母48个,俄文字母66个,汉语拼音符号26个,汉字注音字母37个,汉字6763个,根据使用频率分为两级,一级为3755个,按汉语拼音字母顺序排列,第二级汉字3008个,按部首排列。

这是编码技术的简要描述。

最近美国人利用找一个大数目的质数因子的困难性及其他质数的一些特有性质,设计了一种可公开传输且保密性极高的密码(一种特别的编码技术),引起军方、工商界的极大兴趣,有关这方面的经费大为增加。目前分解一个整数n的因子仍停留在近似硬试的阶段,若已知n为50位的数,则分解n要除1025次,以每秒106次的计算机计算速度,则要工作1011年。密码的价值是众所周知的。商业信息是商家获利的重要资源。某一信息(例如某项发明、或某几个公司合并资产重组、股市动态等)转瞬间可以获利数亿、数十亿、数百亿甚至数千亿美元。例如2000年4月14日,道琼斯指数下挫617.78点,日跌幅达5.66%;纳斯达克指数下挫355.48点,日跌幅达9.67%,其中英特尔下跌8.77%,损失377亿美元,微软下跌6%,损失240亿美元。因此,如何获得或保持商业机密,是商家一直努力的目标。自然,商家更希望得到重要的数学技术——编码技术的支撑。