基于语料库的莎士比亚戏剧汉译研究
上QQ阅读APP看书,第一时间看更新

第2章 莎士比亚戏剧英汉平行语料库的创建

2.1 引言

莎士比亚研究一直是西方文学研究的“显学”之一,相关著作可谓“汗牛充栋”。自20世纪初以来,莎剧的多个汉译本相继问世,其中影响较大的译本有朱生豪(1947)、梁实秋(1947)和方平(2000)等翻译的汉译本。这些译本对我国现代戏剧和文学创作产生了深远的影响,而且很大程度上丰富了汉语的表现形式。然而,莎剧汉译研究的广度和深度仍然比较有限。现阶段莎剧汉译研究局限于具体词汇或修辞手法的翻译研究,而关于句法和语篇层面的研究成果比较少见,且多为定性研究,较少进行定量研究,鲜有成果。此外,鲜有成果利用语料库方法对莎剧的汉译开展系统和深入的研究。

很显然,这与莎剧汉译本在中国文学乃至文化发展历程中的重要地位十分不相称。究其原因,主要是因为莎剧剧本多,内容博大精深,莎剧汉译研究因而费时费力。显见,建设莎士比亚戏剧英汉平行语料库,开展基于语料库的莎剧汉译研究十分重要。研究人员可以充分利用语料库储存数据大、计算机运行速度快、语料库工具能准确对大量数据进行分析的优势,系统、全面地对多个莎剧汉译本进行比较分析,通过数据分析和功能阐释相结合,获得客观可信的研究结果。

为此,我们自2005年起便开始着手建设莎士比亚戏剧英汉平行语料库。经过数年的努力,我们已建成莎士比亚戏剧英汉平行语料库,并开展了一系列前期研究。该语料库收入莎剧原著,这些戏剧的梁译本、朱译本及方译本,以及汉语原创戏剧,总库容为3068634字(词),具体情况如表2.1所示。

表2.1 莎士比亚戏剧英汉平行语料库的构成

根据表2.1,汉语原创戏剧的形符数与方译本和朱译本的形符数相当接近,与梁译本的形符数也相差不大。因而,汉语原创戏剧与莎剧的以上汉译本之间具有较为理想的可比性。

应当指出,建设平行语料库,尤其建设能够实现一个原著与三个译本句级对齐,且库容达数百万字的语料库,不仅要耗去大量的人力和物力,而且技术层面亦具有较大难度。本节拟介绍莎士比亚戏剧英汉平行语料库的创建过程。

一般而言,英汉平行语料库的创建步骤主要为:①中英文语料的选择与输入;②语料的预处理;③语料的标注和分词;④语料的平行对齐;⑤语料库出版;⑥语料库网上检索。目前,莎士比亚戏剧英汉平行语料库已完成第1至第4个步骤。至于语料库的出版和网上检索,待完成所有语料的输入和深加工,并解决相关版权问题之后方可进行。