自然语言交流的计算机模型
上QQ阅读APP看书,第一时间看更新

3. 数据结构和算法

我们可以直接观察到认知主体的外部界面及其输入输出(见1.4.3),但数据结构和算法必须依其在自然认知当中的功能而定。在自然语言交流过程中,算法必须(i)把经由符号识别得到的输入映射为适合存储在主体数据库当中的格式(听者模式),(ii)选择性激活和调整数据库中的内容(思考模式),(iii)把适当格式的内容以自然语言语表的形式读出数据库,进行符号合成(说者模式)。

数据库语义学当中,这些功能由时间线性的LA语法的算法来完成。LA语法的三个变体称作LA-hear,LA-think和LA-speak。支持该算法的数据结构是一个经典网络数据库(见Elmasri and Navathe,1989),称作词库(word bank)。词库存储非递归(nonrecursive)特征结构(feature structure),称作命题因子(proplets)。从结构上看,命题因子等价于经典数据库里的记录。