自然语言交流的计算机模型
上QQ阅读APP看书,第一时间看更新

1.1  以符号还是以主体为导向来进行语言分析?

自然语言的表现形式是语言符号。某一语言环境下,符号与符号之间的结构关系是约定俗成的。认知主体在说者模式下生成语言符号,在听者模式下解析语言符号,这些符号是在说者与听者之间传递内容的媒介。有的科学分析聚焦于孤立的语言符号,有的聚焦于进行语言交流的认知主体,我们据此将这些分析方法分为以符号为导向的和以主体为导向的两种。注11

以符号为导向的方法包括生成语法、真值条件语法和语篇语言学等。它们把自然语言的表达方式作为研究客体,研究材料来源于书本、磁带或者电子媒介物。这种分析是脱离交流的抽象分析。其语言学样本脱离了交流主体,根据可替代性原则被解析为层次结构,不适合也不以模拟说者和听者模式为目的。

数据库语义学(DBS)以主体为导向,不同于以符号为导向的分析方法。数据库语义学(DBS)的分析过程中,语言符号是说者生成语言的结果和听者理解语言的起点。要把语言生成和语言理解结合起来,需要遵循语言的时间线性顺序,根据可接续性原则对主体生成语言和理解语言的各个步骤展开来分析。

数据库语义学的目标是建立一个功能完备、数据完全、计算复杂度小而计算机操作性强的关于自然语言交流的理论。该理论的核心问题是:

自然语言交流是如何进行的?

下面,我们以最简单的方式来回答这个问题。

自然语言交流发生在两个认知主体之间。他们在世界上实实在在的存在着,具有各种各样的外部界面。这些外部界面帮助他们进行语境层的非语言识别和行动,以及语言层的语言识别和行动。同时,每一个认知主体都有一个数据库来存储内容。这些内容由主体的知识、记忆、当前识别到的内容、意图和计划等构成。

认知主体可以在说者和听者模式之间转换(角色转换)注12。交流时,说者模式下的主体将数据库中的内容编码为语言符号,通过语言输出界面在外部得到实现。另一个在听者模式下的主体通过语言输入界面来识别这些符号,对其内容进行解码,之后存储到自己的数据库当中。如果由说者编码的内容被听者等价解码并存入数据库,则视为交流成功。

数据库语义学的角色转换模型建立在特殊的数据结构和LA(Left-Associative,左结合)时间线性算法相结合的基础之上。注13LA算法有三个变体,称作LA-hear(听),LA-think(思考)和LA-speak(说)。交流过程中这三个语法相互合作,如下图所示:

1.1.1  角色转换基本模型

图右边的主体(说者模式)内,LA-think选择性激活存储在数据库里的内容。被激活的内容通过LA-speak映射为自然语言语表,实现为外部符号(在图中用带s的方块表示)。图左边的主体(听者模式)内,LA-hear对符号进行解析,之后存入自己的数据库。

1.1.1所示的角色转换可以从以下两个角度来理解:

1.1.2  角色转换的两个角度

1. 从外部看

两个交流主体分别担任不同的角色。1.1.1所示图中的两个大方块分别代表两个不同的主体,一个在说者模式下,另一个在听者模式下。

2. 从内部看

每个主体本身在说者模式和听者模式之间进行转换。1.1.1所示图中的两个大方块代表同一个主体分别处在听和说两个不同的模式之中,这两个模式之间相互转换(虚线向右的箭头表示转换)。    数据库语义学的角色转换是一个定义明确的计算问题,也是对自然语言进行语言学分析的核心问题,所有的句法和语义分析都必须在角色转换这一最基本的交流机制下进行。没有角色转换,其极端结果就是单方面的自言自语。