第二章 语汇重要,语汇难 词汇与语汇
一 必也正名乎——字真的仅仅是文字学的单位吗
张志公先生曾撰文《语汇重要,语汇难》(《中国语文》,1988年第1期),指出“在语音、文字、语汇、语法四者之中,语汇比较重要,也比较难”。张先生所说的“语汇”,就是词汇。张先生一语中的,既点出了词汇在语言体系中的重要地位,也指出了对它的研究貌易实难的实质。
(一)字是汉语词汇单位
字究竟是何单位?这一本来无须讨论的问题却在20世纪50年代初成了必须讨论的大是大非的原则问题。在50年代中国语言学界爆发的那场字本位还是词本位的大讨论中,反对将字看做语言词汇单位的人认为,字是文字的单位,不是语言的单位,将字视为词汇的单位是字本位的观点,是早该抛弃的陈腐观点;坚持将字看做语言词汇单位的人数远不如反对者多,声音一发出即遭淹没。这种局面直到90年代初才略有改观。字果真只是文字学的单位吗?在中国现代语言文字学产生之前两千多年的历史中,人们都习惯说“字”,并让它指称20世纪初才产生出来的“词”、“语素”等所指的对象。字如果仅指文字学意义上的形体符号,不是/也不能充当语言学意义的单位,那么它在两千多年历史中的意义所指就成了问题。即使在今天看来,字也未必就仅指文字学上的形体符号,我们常听人说“他说了半天,我一个字也没听懂”“请你大点儿声,你刚才说的话老人家一个字也没听见”,这些“字”都非文字形体之意,而是语言词汇单位之意。《现代汉语词典》也为“字”设立了一个“字眼;词”的义项,承认它并不仅指文字形体符号。因此,毫无疑问字应该是汉语词汇的一级单位,是基础性的单位。
(二)字和语素的关系
字并不时时处处都与语素画上等号。语素的定义是语言中最小的音义结合体。举凡语言中存在的音和义的结合物,只要它是最小的、不可再行分解的,就是语素。这就出现了两个大的问题。第一,语素的定义并未说明它一定是词汇层面上的音义结合体。换言之,其他层面上的音义结合体,只要它是最小的,也未必不可以称作语素。第二,按照现有的语素的定义,它只是对结合而成的那个音义结合体提出要求,要求其必须是最小的音义结合体,不可再行分割,却并未将构成它的音、义分开来说明是否必须都是最小的。事实上,音是否最小,人们并不看重;而义是否最小,才是人们最看重的。
在汉语中,字元数与音节数在绝大多数情况下是一一对应的,即一个汉字发之于口的音节形式是一个;一个音节形式,其著之于书面上的字元是一个。但是不相一致的情形也还是存在的,如一字元二音节的“瓩、呎、吋、唡、哩、”(一字元承载二音节是极限,汉字中没有一字元承载三音节或三音节以上者),一音节二字元的“花儿”(一音节承载二字元也是极限,汉字中没有一音节承载三字元或三字元以上者)。当一音节二字元的“花儿”这样的形体出现在人们面前的时候,似乎无人会对“花儿”的一个语素的资格持怀疑态度,因为人们认为“花儿”的“儿”只表示一个卷舌动作,不自成音节,不算具有一个独立语素的资格;当一字元二音节的“瓩”这样的形体出现在人们面前时,好像也没有多少人会因“瓩”在读音上分为两个音节而将其视为两个语素,因为“瓩”的文字形体又起到了约束其无法拆分为两个语素的作用。可见在语素的认定上,人们的态度是宜合不宜分的,即只要有可能不把字元、音节大于一个的形式算作不同的语素,人们还是尽量将其视为一个语素。
也就是说,字元可以在空间上延伸为占两个或更多个方块的面积,音节也可以在时长上拉长到两个或更多个音节的长度,只要这字元之多、音节之长还不足以使人们认定它已在表示两个或更多个语素,那么人们还会将其认定为一个语素。正因如此,传统上的联绵词,虽然它一般由两个字构成,但古人仍称其为“联绵字”而不是“联绵词”,现代人则把它们看作两个字表示的一个语素、一个词。用汉字拟写其他语言的音而成的汉语外来词,尽管可能需要八九个甚至更多个字来表示,但中国人仍将其视为一个语素、一个词。
(三)字组合为词的模式
字与字组合可构成词,构成过程受字义的制约。字可分为有义字、无义字、弃义字三类。有义字如“天、地、吃、穿、好、坏、很、真”;无义字如“琉、璃、氆、氇、葡、萄、蝌、蚪”;弃义字如“纳米”中的“纳、米”,“克隆”中的“克、隆”,“雷米封”中的“雷、米、封”,“福尔马林”中的“福、尔、马、林”,它们在所组成的词中丢弃了其本有的字义。
字与字组结为词的模式主要有如下几种:
(1)有义字+有义字,如“人民、悠闲”。有义字又可分别为实义字和虚义字。实义字不必多说,虚义字有“呢、着、的、乎”。实义字+虚义字的例子有“有着、的话、来着、在乎”,虚义字+虚义字的例子有“着呢、着哩、然则、之乎者也”。
(2)有义字+无义字,如“瘫痪”。
(3)有义字+弃义字,即其中一个字取汉语本来的意义,另一个字是取译借的外语成分的。例如译自Man.United的“曼联”,“曼”是弃义字,“联”是有义字。类似的例子还有 “酒吧、沙皇、摩的、刷卡”。
(4)无义字+无义字,如“琉璃、氆氇、峥嵘、蝾螈”。
(5)无义字+弃义字,如“扎啤(‘扎’英draft,‘啤’英beer)、氧吧”。
(6)弃义字+弃义字,如“坦克、马达、杯葛、哈达、热瓦甫、冬不拉、盘尼西林、英特纳雄耐尔”。
汉语中甚至有“IC卡”这类用西文字母+弃义汉字构成的词。以西文字母+弃义汉字构成的这类词,在专有名词中亦可见到。例如葡萄牙足球运动员Cristiano Ronaldo Dos Santos Aveiro,该英文名字译成中文为“克里斯蒂亚诺·罗纳尔多·多斯·桑托斯·阿维罗”。一则是嫌这样长的名字难以称呼,再则是为了区别于西班牙足球运动员Ronaldo Luiz Nazario De Lima(中文译名为“罗纳尔多·路易斯·纳扎里奥·达·利马”),于是将其称作“C罗”。
有的有义字功能甚至比不上无义字、弃义字。例如“招徕”中的“徕”只能出现在与“招”组合的场合,组合成“招徕”;“蠲免”中的“蠲”只能出现在与“免”组合的场合,组合成“蠲免”。当然,这些组合功能非常弱的汉字,在历史上组合功能未必就如同现在一样弱,有的甚至完全可以独立使用。如“徕”在《论语·季氏》中就独立出现在“故远人不服,则修文德以徕之”的句子里。无义字亦可在一定条件下构成复合词,如“叮咛、嘱咐”都是联绵词,但是由这两个词的构词要素构成的“叮嘱”却是复合词。
(四)字的构词能力
构词能力大小,固然与该字是否能独用有关;一般能独用的字,构词能力会强一些,不能独用的字,构词能力会弱一些。但这一点不可绝对化,因为有的字虽不能独用,但其构词能力并不弱,如动词性的“就”一般不独用,但却可构成“就义、就餐、就读、就学、就刑、就戮、就职”,甚至“就浴”等;反之,常独用的一些字却不一定有很大的构词能力,如“的、也、吗、呢”。当然,也有在历史上独用而没有大构词能力而在后来发展为构词能力超强的情况,如“零”,现在可构成“零距离、零接触、零付出、零污染、零支付”等。
不少学者在谈到语素的性质和功用时,用“自由”作为词根的特性,用“粘着”作为词缀的特性。这或许并不适当。粘着的字不一定就可以充任词缀;词根也有粘着的。再进一步看,词也有粘着与自由之分,如“无乃、岂非、代为、自相、之内、之最”就是粘着词。与粘着字一样,有些粘着词也可能随着发展变成自由词,如“之前”在20世纪90年代之前必须附着在一个表示时间的体词性成分后才可使用,大约从90年代开始它渐可用于句首,变成自由词了。自由的字也未必就是词根;词缀也有自由度大小之别。词缀、词根(以及词干之类),是从构词来谈的,而自由、粘着是从字(语素)结合度、使用度来谈的,两者不可混为一谈。自由的字多为结合面宽的语素,粘着的字多为结合面窄的语素。构成一个词的两个字,可能一者是自由的,结合面宽,一者是粘着的,结合面窄,如“睫毛、楼宇”;可能两者都是自由的,如“吃紧、后爹”;或两者都是粘着的,如“疆埸、晋谒”。汉语如此,英语也是这样。例如blackbird,black和bird结合面都很宽,都较为自由,而outlandish中的out结合面很宽,较为自由,landish结合面很窄,是粘着的。再如cranberry中的cran远不如berry结合面宽。但是landish和cran都并非词缀,而是词根。