1.5 研究方法
1.5.1 文献研究法
文献研究法是科学研究常用的方法之一。现代科学研究都建立在时贤前修们的研究基础之上,一旦选题确定,我们需要通过搜集、分析、研究现有文献,进而结合自己的分析归纳出新的观点或结论。我们的研究也不例外,国内外对词语搭配本体和教学进行了多方深入的探索,本研究就是在这些文献的基础上进行的。文献研究法在本研究中有两方面的体现:首先是文献回顾部分,我们对该选题的国内外文献进行了综述,从而明确了该领域的基本情况,为我们下一步的努力指明了方向;其次,本书第2章“词语搭配与词汇知识体系”和第3章“语言教学视角词语搭配研究框架”也是在对现有文献进行研究的基础上结合我们的研究实际提出的。
1.5.2 描写与解释相结合的研究方法
语言研究的基本工作是语言事实的描写,进而用相关理论对语言现象做出解释,因此本研究坚持描写与解释相结合的原则。本书对词语搭配的研究以描写为主,辅以适当的解释。首先,基于大规模语料库统计出词语搭配的各项概率;其次,在统计的基础上,结合词语出现的语境尝试进行归纳总结;最后,在词语学、语义学和语言习得理论的指导下做出解释。整个过程中,我们坚持描写与解释相结合的研究方法,坚持用以上理论观察分析语言材料。
1.5.3 定量研究和定性研究相结合的研究方法
定量研究和定性研究是科学研究所采用的两种主要方法,二者的融合已经成为当下研究的趋势。定性研究是从研究者的观察出发,主要使用思辨的方法,对所搜集的材料进行归纳,进而得出结论的研究活动。定量研究是对事物可以量化的部分用数据表示的方法,目的是以数据检验研究者关于某事物的论断是否符合客观实际。在本书中,定量研究主要体现在通过语料库对语言材料的统计方面,我们坚持用数据说话,用各项统计指标来展示我们的研究结论;定性研究主要体现在对数据的分析、解释方面。因此,本书坚持定量研究和定性研究相结合的研究方法。
1.5.4 对比的研究方法
“对比”在某种程度上就是“比较”。“比较”是科学研究的基本方法,是人类认识客观世界的一般手段,是认识不同事物异同的重要逻辑方法之一。这种研究方法已被广泛运用于科学研究的各个领域,语言学界也不例外,如前辈语言学家吕叔湘就非常推崇对比的研究方法。在大规模语料的检索没有实现之前,对比往往局限于定性研究,而基于语料库的对比分析能够把定性研究和定量研究结合起来,使得研究结论更加科学可信。本研究涉及多个层面不同语言材料之间的比较,如汉语和学习者母语的对比;汉语内部不同词项之间的对比,即处于同一个语义场内的不同动词搭配之间的对比;目的语和中介语的对比,即汉语和学习者语言系统的对比;不同性质学习者语言材料之间的对比,比如不同语言水平、不同母语背景等。
1.5.5 基于语料库统计的研究方法
基于大规模语料库的统计方法被新弗斯学派的学者们广泛应用于词语搭配的研究之中,甚至已经成了他们研究词语搭配的一项基本原则。Sinclair和Berry-Rogghe等学者最早提出了基于语料库数据计算研究的相关概念,如节点词、跨距、搭配词等。在语料库语言学基本观念的指导下,本研究采用两种基于语料库统计的方法,即基于索引证据的词项-环境法和基于跨距设定计算搭配词的词项-环境法。
基于索引证据的词项-环境法是指,借助于计算机的辅助从大规模语料库中提取出词项索引,在观察词项索引的基础上描述、归纳词项搭配行为的研究方法,目前词语搭配研究所采用的基本都是关键词索引法(key word in context),英文简称为KWIC。下面是我们在北京大学“现代汉语语料库”中以“帮助”为词项随机提取的15条索引的截图(见图1-1)。
图1-1 索引证据词项-环境法语料排列示意
这里的词语索引就是词项-环境法中所说的“环境”,关键词索引法中的关键词其实就是Sinclair所说的节点或者叫节点词,一般来说是节点词居中,两边是在文本中与其共现的其他词项。从上边的实例我们可以看到这种方法的优势,它把词项的组合关系和聚合关系都直观地呈现给我们,从横向来看,呈现给我们的是节点词与搭配词的搭配情况,如第一条语料中节点词“帮助”的左边是“他父亲”,右边是“照顾”;第二条语料节点词左边是“街道”,右边是“这个制花厂值班”。我们可以看出,节点词的搭配模式大概有三种,即“某人帮助某人(做某事)”、“某人给某人帮助”和“在某人的帮助下”。从纵向来看,呈现的是搭配词之间的聚合关系,“帮助”左边的搭配有一类是体词性成分,如“他父亲”、“她”、“街道”、“男友”等,也有谓词性成分,如“有”、“给”、“得到”、“带来”等,还有“在某人的帮助下”这个结构,通过对这些成分的分析,我们可以总结、归纳“帮助”这个词项的搭配行为和意义特点。研究者需要做的就是基于这个索引对词项的句法、语义、语用特点进行描写、归纳。
基于跨距设定计算搭配词的词项-环境法,是指根据研究需要设定跨距,利用程序统计出跨距内词项与搭配词的共现情况,进而描写、总结词项行为的研究方法。根据Berry-Rogghe(1973)和Jones、Sinclair(1974)的相关研究,跨距设定为-4/+4或-5/+5是最好的选择,本研究把跨距设为-5/ +5。这种研究方法的优势是显而易见的,即可以几乎不费任何人力统计出词项搭配词的各种属性,如距位、出现频率等。距位是指跨距内各个搭配词所处的位置,如在跨距为-5/+5的情况下,距位分别是-5、-4、-3、-2、-1、1、2、3、4、5,其中-1和1分居节点词的左右最近距位。下面是从北京语言大学“现代汉语研究语料库系统”中提取的“帮助”最高频的31个共现词及其频次与距位分布(见表1-1)。
表1-1 “帮助”频数13次以上共现词及频次
表1-1包含了各种信息,其中有些共现词对节点词的搭配行为几乎没有预见作用,如“人”、“一”、“不”、“就”、“了”、“这”、“都”等,这些词的特点是几乎平均地分布于跨距内,比如说“人”在频率上处于第三位,可谓高频了,共54次,左右分别24次、30次,并且在左右各个跨距内没有明显变化,造成这种现实是由于语言使用的某种偶然因素使其落入了限定跨距内,这被Sinclair(1966)称为偶然搭配(casual collocation),它们不是搭配研究要关注的对象,是干扰因素。我们可以发现,虚词“的”是出现频次最高的,共155次,左右分别为89次、66次,左侧有51次的距位是-1(57.3%),即节点词“帮助”的左边第一个位置,这往往能够揭示出节点词活动的句法型式,通过上述索引证据我们可以推测“在某人的帮助下”和“得到某人的帮助”是它的重要句法型式。其他虚词,如“在”、“对”、“能”、“可以”、“互相”属于左搭配词,“下”属于右搭配词,它们都提供了有效的信息。“我”、“他”、“他们”、“她”、“你”是出现频率比较高的体词性搭配,它们分布相对比较均衡,但是有一个明显的特点,那就是趋向于分布在距位右边第一个位置上;“有”、“去”、“来”、“需要”等谓词性搭配是左搭配,也提供了丰富的信息。基于跨距设定计算搭配词的方法的优势是显而易见的,但是也有它的不足,最明显的就是它不能给出词项活动的句法型式,而采用基于索引证据的研究方法虽然能够直观地观察到词项的句法型式,但其不足之处是对共现词的频率因素考虑不足,可以看出,这两种方法正好形成互补。因此,本研究结合这两种方法对动词的搭配信息展开统计。