自然语言交流的计算机模型
上QQ阅读APP看书,第一时间看更新

4.6  普遍命题因子和语言相关命题因子

自然语言的功能是交流,而形式(包括自然语言的形式)为功能服务。作为一个抽象的陈述性规范说明,数据库语义学适合所有自然语言——原因就在于自然语言交流是如何进行的。不同的自然语言(如英语、汉语、菲律宾语或者克丘亚语)之间的种种区别对于数据库语义学的基本框架没有任何影响。那么问题是:

• 自然语言之间的区别是什么?

• 如何把这些区别融入数据库语义学?

自然语言之间的最明显区别在于语表不同,体现在词命题因子上就是属性“sur”的值(见3.2.1)不同。如果两种语言足够接近,接近到其实词表示的概念相同,那么表现词命题因子上,就是核心属性值相同(见3.2.2)。

对于两种或者两组不相关的语言,传统的划分标准是它们的词根不同,如印欧语系和芬兰乌戈尔语系。如果这些词根代表的是界定明确的简单概念,如父亲、母亲或者水,那么它们的核心属性值可以相同。不然,就要重新定义新的概念,指明词根之间不可通约的关系。

最后是依存于语言的区别。语法关系和语法差异通过功能词(如冠词、连词、介词)来解析,或者用形态学的方法(如屈折变化、粘着、推导、合成)来进行综合。数据库语义学解决这些问题的方法是采用依存于语言的LA语法,建立一部合适的词典、搭配相关的词形自动识别和生成系统、采用控制变量(如13.2.2)来处理一致性问题(如13.2.3),以及用规则来调整语序(如13.2.4)等。

从功能上看,数据库语义学把自然语言之间的区别处理为较低层次(如属性值)上的相对微小的变化。但是,从语言学的角度看,数据库语义学处理自然语言的共性和个性的方法如下面这个架构所示:

4.6.1  数据库语义学的概念和区别架构

这棵结构树的根部是词形的时间线性组合(第 “0”层)。自然语言的这一最基本的结构特性如3.6的DBS-字母系统所示。

该构架第“1”层分作(i)词形和(ii)关系两个部分。词形又分成实词和功能词(level 2),关系分为纵向和横向关系。

实词按三种基本的符号种类分为标志、指示词和名称(第“3”层)。关系分支上,这三种符号服务于纵向的指代关系(第“3”层),应用于语言和语境之间的匹配(见3.2.4)。

这三种符号(第“3”层)和词性(第“4”层)相互关联。标志可以是动词、形容词或者名词;指示词可以是形容词或者名词;名称只能是名词,如图中符号种类和词性之间的连线所示。关系分支上,词性服务于横向的函词论元结构和并列关系(见3.2.4)。

第“4”层和第“5”层之间是一条虚线。虚线以上的部分是共性部分:所有自然语言都有词形的时间线性组合、实词与功能词的划分、三种符号、三种词性注61、纵向的指代关系以及横向的函词论元结构和并列关系。

虚线以下的部分是个性部分:例如,印欧语系的动词有性、态和时(第5,6和7层)、价位结构(第“8”层),以及人称和数的区别(第“9”层)。形容词则有定语和状语的区别,以及级(原级、比较级和最高级)的综合处理。名词有不同的格、数和性上的差异(有些语言没有注62,如韩语)。