自然语言交流的计算机模型
上QQ阅读APP看书,第一时间看更新

3.5  自然语言交流循环

两个主体A和B正常对话的过程中,A说B听,然后B说A听,如此反复。自然语言交流循环要求主体A和B能够在听者模式和说者模式之间进行转换(角色转换,见1.1.1)。数据库语义学通过把语言识别(听者模式)的外部界面和语言行动(说者模式)的外部界面实现为LA语法的相应变体来模拟自然语言交流循环。这些外部界面称作LA-hear和LA-speak,都和主体的词库紧密相连。

LA语法的第三个变体,称作LA-think,位于词库的语境部分,其任务是在各个数据之间移动某个唯一的焦点,从而选择性激活相关的内容。这样,可以把命题因子之间的语义关系看作是一个特殊的铁路系统,而LA-think就是使焦点沿着这个系统的轨道运行(自主导航)的机车。

LA-think的规则和LA-hear的规则相似(见3.4.3)。但是,LA-think规则的作用是在词库中提取给定命题因子的接续因子,从而驱动导航。下面以3.4.2中求导命题的命题因子“know”为例说明LA-think规则的应用情况。完整的LA-think语法定义见3.6.7,10.6.1,12.1.1和14.1.1。

3.5.1  LA-think规则应用示例

规则中的“ss格式”匹配前一个在词库中被激活的命题因子,变量“β”纵向绑定(属性“verb”的)值“know”,变量“α”绑定“Julia”或者“John”,“k”绑定(属性“prn”的值)“22”。假设变量“α”绑定的是“Julia”,通过属性“prn”的值“22”提取(激活)命题因子“Julia”,之后再回到动词命题因子(操作“output position ss”)。为了避免重复遍历同一个命题因子(relapse,见“tracking principles”,FoCL’99,p.464),当前提取到的属性“arg”的值前面添加标记“!”。

3.5.2  LA-think规则应用的结果

接下来,可以再次应用规则“V_N_V”(见3.5.1规则包),来激活命题因子“John”。

通常,词库里的每一个命题因子都有一个以上的可接续词(successor)注46,LA-think必须从中作出选择。最基本的方法有两个:任意选择,或者根据某个预定义的图式(schema)来作定项选择。但是,对于有意义的自然语言交流这样的理性行为,LA-think语法有必要成为一个完善的控制结构,在评估内外部刺激、已遍历频率、已知程序以及主/述位结构等的基础上,在备选的可接续词之间进行智能选择。注47

目前,我们假设一次标准导航的定项图式首先从动词(函词、关系)开始,接着是名词(论元、宾语),名词和名词之间的顺序依照动词属性“arg”槽内各个值的顺序。这样的一次导航可以用“VNN”来表示,其中“V”代表动词命题因子,第一个“N”代表主语,第二个“N”代表宾语(见附A)。

原则上,词库里的任何一次导航都不受语言的限制。但是,对于有语言功能的主体来说,导航是说者概念化的过程,也就是说,是说者选择说什么和怎么说的过程。

把概念化定义为按照时间线性顺序在内容之间进行导航的过程,语言生成就变得相对直接了:当说者决定向听者传递一次导航,导航遍历到的命题因子的核心属性值就被转换成特定语言的相应词汇,并实现为外部语言符号。除了普遍导航需要的依存于语言的词汇化过程之外,系统还必须提供依存于语言的如下因素:

1. 语序

2. 功能词析出注48

3. 词形选择,以满足一致性关系

这个过程由依存于语言的LA-speak语法和词形生成程序共同完成。例如:词形“ate”由命题因子“eat”生成,其属性“sem”的值为“past”。完整的LA-speak语法定义见12.4.1和14.2.1。

以LA-think和LA-speak为基础的语言生成可以用同一个简化图式来表示,下面以VNN导航实现“Julia knows John”为例。求导过程强调如何处理语序和析出功能词,词法和句法分析从略:

3.5.3  Julia knows John的生成过程

字母“i”代表句子编号。字母“n”、“fv”和“p”是抽象语表,分别代表“name”、“finite verb”和“punctuation(这里是句号)”。

在“i.1”行,根据LA-think,导航从A转移到N,求导开始。命题因子N由LA-speak实现为“n Julia”。在“i.2”行,命题因子V由LA-speak实现为“fv knows”。在“i.3”行,LA-think导航继续,到达第二个命题因子N,由LA-speak实现为“n John”。最后,LA-speak根据命题因子V实现“p”(“i.4”行)。一次VNN导航就这样实现为语表,其语序为“n fv n p”。

这种生成方法不仅可以用来实现上例中的主-动-宾(SVO)注49语表,还能实现SOV和VSO(见附录A)。不同自然语言的语序和词汇化都可以由依存于语言的LA-speak语法规则来处理。LA-speak语法规则的概念基础就是3.5.3所示的抽象求导。

三种LA语法的操作,部分注50地决定了人工智能主体所处的状态:LA-hear运行时,主体处于听者模式;LA-think运行时,主体处于思考模式;LA-think和LA-speak同时运行时,主体处于说者模式。

下面用图形来概括LA语法的三个变体在自然语言交流过程中的互动情况:

3.5.4  自然语言交流循环

上图所示为两个主体,一个在听者模式下,一个在说者模式下。每个主体都有自己的词库,包含语境和语言两个部分,以及识别和行动外部界面。

说者模式下的主体只使用语言部分的界面,即LA-speak,而听者模式下的主体只使用语言识别界面,即LA-hear。也就是说,如2.5.1中所述,两个主体间的互动恰好是一个媒介指代的过程(语境层没有行动外部界面)。

语言生成过程中的词形排序起始于时间线性导航,导航发生在说者词库内的语境命题因子之间,由LA-think驱动,如图中右侧主体框架里的曲线所示。导航过程中遍历到的语境命题因子匹配相应的语言命题因子,构成LA-speak的输入。LA-speak的输出是外部符号,即构成LA-hear输入的一系列未经分析的语表。LA-hear求导出的命题因子对LA-speak的导航内容进行重新建构,各个命题因子在被添加进合适的个例行的过程中,其外部顺序被打乱。如果说者编码的内容被听者等价重构则交流成功。