上QQ阅读APP看书，第一时间看更新

绪论历史比较语言学理论的发展：从同源论到亲缘度

历史语言学最辉煌的时期是19世纪，随着20世纪初期索绪尔《普通语言学教程》的出版，人们的注意力开始转向语言的共时研究而非语言的起源及演化。从大量介绍现当代语言学流派的著作里，绝少看到历史语言学某个流派的出现。虽然如此，仍然有大批学者在该领域孜孜以求，他们不仅提出了很多新假说、新理论，还使用新方法，并且借助其他领域的最新研究成果，把历史语言学再向前推进，特别是美国历史语言学家格林伯格（Joseph Greenberg）的四大世界超级语系假说，在语言学界刮起了一股强烈旋风，再次吸引了无数专家学者的眼光，震动了历史语言学界，可以说是自新语法学派以来最大的也是唯一的一次轰动。他的假说与当代其他超级语系假说一起，不仅在方法上与传统学者相背离，而且在理论上跨度很大，传统学者主张同源探究，当代学者更侧重亲缘度考察。

一语言同源关系研究的萌芽

最早关于语言亲属关系的研究是从12世纪的“第一语法家”（佚名）开始的，他根据英语和冰岛语在词形上的相似认为二者同源。但是欧洲学者的同源关系研究始于Dante（1265—1321）。他在《论俗语》一书中说到，不同的方言及后来的不同语言，是由同一个原始语言，经过历时变化及使用者在地域上的扩散发展来的。他把欧洲语言分为三组：北方的日耳曼语族、南方的拉丁语族、欧洲及部分亚洲的希腊语族。Dante及当时的其他学者都认为希伯来语是最原始、最古老的语言，后来Joseph Justus Scaliger（1540—1609）批判了这种观点。他把语言分为11族，包括4大族、7小族，分布在欧洲大陆，族内各语言有亲属关系，但各语族间的亲缘关系无法确定，他根据拉丁语演化为罗曼语的模式，认为这些语言来自过去的某一种语言。17世纪的学者们也曾对语言分类用比较法研究，但影响不大。

到了18世纪，德国哲学家、历史学家、数学家、神学家和律师G.W.Leibniz（1646—1716）发表了一篇重要的论文《论国家的起源》，他写道：

语言的研究，除了正确的科学原则之外，不能用其他的原则来进行。为什么不从已知的开始而从未知的开始呢?我们应当从我们所能得到的语言的研究开始，把它们互相加以比较，找出其中的相异点和相同点，然后进一步去研究那些前一代的语言，揭示它们的亲属关系和来源，再一步一步直追溯到最古的语言，这才是合理的；这些最古语言的分析一定可以使我们得到唯一可以相信的结论。[1]

他请求很多人帮助他收集世界各地语言资料，并且指出各地方言土语的词汇对解释语言起源的重要性。他对语言做过分类，但都是不成系统的，并且很多是错误的。他认为语言有个共同的来源，人类是由东方移到西方的。现在看来他的这种观点与目前的“人类起源于非洲”观截然相反。他也无法辨认各种语言间的亲属关系。在那个年代，没有任何资料，没有电脑，能够做到这一步，已经是一个巨大的进步。

俄国女皇伽德邻（1762—1796）赞同Leibniz的计划，她曾幽居近一年专门编纂比较词典。最终《全球语言的比较词汇》（Glossarium Comparativum Linguarum Totius Orbis）于1787年在彼得堡出版，第1卷包含285个词，翻译成51种欧洲语言和140种亚洲语言。第2版由Jankiewitsch de Miriewo 主编，按字母排列，共分4卷，于1790—1791年出版，包括185种亚洲语言，52种欧洲语言，28种非洲语言，15种美洲语言，共280种语言，比第1版规模大。

1773年法国学者 Court de Gebelin 的《原始语言的分析与现代世界的比较》把波斯语、阿美尼亚语、马来语、科伯特语看作希伯来语的方言，认为巴斯克语是克勒特语的方言。[2]现在看来完全不合实际。特别是巴斯克语的系属，截至目前仍是众说纷纭。西班牙耶稣会士Lorenzo Hervasy Panduro于1880年出版的《语言目录》（Catálogo de las Lenguas）整理了40多种语言的语法，第一次指出语言真正的亲属关系主要取决于语法，而非词汇。他用名词和动词变位的比较表证明希伯来语、却尔地亚语、叙利亚语、阿拉伯语、埃塞俄比亚语、Amharic语同源，并确定了闪语系，看到了汉语和汉藏语系方言，匈牙利语、拉普兰语和芬兰语有亲属关系，并且证明了巴斯克语非克勒特方言，而是早期住在西班牙的一个独立部落的语言。[3]这比 Court de Gebelin进步了一些。认为马来语和波利尼西亚语同源，这在当时是一个非常了不起的发现。他不懂梵语，但他对希腊语和梵语做过比较，由于他认为希腊的哲学和神话来自印度，因此希腊语的一些词也是借自印度，没法确定两种语言是否同源。

基于《语言目录》和《比较词汇》编制而成的《普通语言学》（Mitridater Soder Allegmeine Sprachenkunde）第1册由 Johann C.Adelung于1806年出版，[4]第2册由Johann Severin Vater续编，1809年出版。第3、4册于1816年、1817年由 Vater和Adelung儿子编辑出版。该书规模比《语言目录》还大，但是材料不尽如人意，有些常识性的东西却搞错了，一些大家都知道的语言关系如印欧语系却没有出现。

这个时期的人们对语言关系的认识只是从地理上加以分类，至于有着遥远距离的几种语言何以相同或相似，他们茫然不知。

1786年，英国驻印度东印度公司职员William Jones（1783年起任英国驻印度法官）在“亚洲学会”宣读论文时说：

无论多么古老，梵语的结构是最奇特的，它比希腊语更完备，比拉丁语更丰富，并且比这两种语言都更精美，可是它们无论在动词的词根方面，还是在语法形式方面，都有很明显的相同点，这不可能是出于偶然的；确实，这些相同点是这样明显，使得考究这三种语言的语文学家，没有一个能不相信它们是出于共同的来源，虽然这个共同的来源现在也许已经不存在了；我们有同样的理由相信，虽然这理由并不那么有力，峨特语和克勒特语，虽然杂有不同语言的成分，也跟梵语有相同的来源。古波斯语也可以加入这一个语系里面。[5]

虽然William Jones有了这个伟大的发现，却没有解释也无法解释这些相同点。

真正做到这点的是德国诗人Friedrich von Schlegel，他在1808年写成的《论印度人的语言和智慧》对于语言科学的建立有着巨大的作用。他第一次使用“比较语法”这个词，认为“比较语法将给我们以关于语言谱系的崭新的知识，正如比较解剖学曾给自然历史以光明一样”[6]。并且他也认识到语音对应对于比较语法的重要性。这些都为语言发展为一门独立的科学打下了基础。

早期的语言同源关系研究还处于懵懂阶段，学者们已经有了这种想法的萌芽，但此时的历史语言学研究是零乱而分散的，研究者的认识和创见在很大程度上没有得到交流，也没有得到不断涌现的后来者的继续和发展，所以后来者没有什么可资借鉴和讨论，他们缺乏实际语言的合适例证，没有计划，没有能够指导的理论成型。[7]不过世界各地语言资料的大量收集，梵语、印欧语之间相同点的发现，都为新学科的建立打好了坚实的基础。鉴于当时条件有限，加上学者们大都来自其他领域，没有一个是专门的语言学家，导致语言研究还局限在有限的范围。但此时人们已经知道要跨出本族语言，到世界各地寻求亲属语，接下来我们要做的就是找到演变规律，推动历史比较语言学这个学科的建立。

二语言同源关系研究正式拉开序幕

Schlegel在《论印度人的语言和智慧》里只提出了“比较语法”这个概念，没有总结出规律，所以只能算是一个先驱者而非奠基者。[8]真正的奠基者有三位：丹麦人拉斯克（Rasmus Rask）、德国人葆朴（Franz Bopp）和格里姆（Jacob Grimm）。

1814年拉斯克用丹麦文写成的《古代北方语或冰岛语起源研究》1818年才出版。他认为，要找出语言亲属关系，必须考察整个结构，最重要的就是语法系统，因为词容易借用，而语法不会。如果最基本、最具体、最不可少的词和另一语言相同，则二者同属一个语系。拉斯克在那个时代就有这样的眼光，实属难得，他已经知道只有基本词汇才能确定语言关系，虽然他没有提出基本词汇这个概念。后面的学者大都依照这样的思路，特别是Swadesh的“100或200词表”就是基于这个理论。他还说，代名词和数词最关键，如果两种语言大体一致，并能找出语音对应规律，那么二者可能有亲属关系，如果整个结构和组织都有对应，则可确定二者同源。基于这种理论，他确定了很多语言的系属，如立陶宛语、拉脱维亚语、斯拉夫语、冰岛语、拉丁语等。

1816年葆朴出版了《论梵语动词变位系统，与希腊语、波斯语和日耳曼语相比较》，该书做语法比较的占157页，其余都是有关梵语原文的编辑和翻译。后来他的名著《梵语、禅德语、阿美尼亚语、希腊语、拉丁语、立陶宛语、古斯拉夫语、峨特语和德语比较语法》（1833—1849）出版，这才是纯粹的比较语法著作。他否认欧洲语言来自梵语，它们出自同一种原始语言，只不过梵语保存有更多原始形式。但是并非每个形式都在梵语里保存完整，有些元音改变了很多，遇此情况，只能借助其他语言的比较才能使之复原，毫无疑问，通过几种亲属关系语言的比较可推测其原始形式，这是葆朴的最大贡献。现在的印欧语系分类也是根据他的理论，梵语和欧洲语言地位相同。

格里姆1819年出版的《日耳曼语语法》找出了很多语言间的语音对应，发现了元音的“变音”（umlaut）和“转音”（ablaut）现象。他最有名的是“格里姆定律”，即

梵语的浊送气塞音（bh-,dh-,gh-），对应希腊语的清送气塞音（ph-,th-,kh-），对应拉丁语的擦音（f-,f-,h-），对应日耳曼语的浊塞音（英文的b-,d-,g-）。

梵语，希腊语和拉丁语的浊塞音（b-,d-,g-），对应日耳曼语的清塞音（英文的p-,t-,k-）。

梵语，希腊语和拉丁语的清塞音（p-,t-,k-），对应日耳曼语的擦音（英文的f-,th-,h-）。[9]

格里姆的研究基本确立了印欧语系，他首创的循环语音对应为以后的研究定下了基调。以后的学者在确定语言关系时如果没有语音对应，基本上被认为是虚假论证。

在三位学者的努力下，印欧语系基本坐实，只不过在那个年代，该名称还未使用。拉斯克、葆朴、格里姆的大发现为后面历史语言学的发展奠定了坚实的基础，大批学者深受启发，研究范围逐步扩大，程度不断深入，在欧洲各国掀起了一股历史语言比较研究的热潮，极大地推动了历史比较语言学的发展。

三语言同源关系研究的大发展

随着历史比较语言学这门学科的形成，历史语言学研究进入大发展时期，一大批学者前赴后继，在这个领域做出了杰出贡献。他们对印欧语系各语言同源关系的论证尤为深入。伴随着波特（August F.Pott）《印度·日耳曼系语言领域内的词源研究》[10]的出版，语言同源关系的论证蓬勃发展，该书把语音和语义相结合，找寻印欧语系词源，探讨语音演变规律，特别注重语音定律的历史性，首次提出必须排除掉偶然相似词。但是像前人一样他也没有认识到语音规律没有例外，并且妄把梵语当作印欧语“母语”，这是一个错误的结论。随即Georg Curtius推翻了这个论点，他不仅证明峨特语不能代表古日耳曼最原始状态，还证明古印欧语很早就分化为梵语所代表的亚洲一支和欧洲一支。但是他没有提出这两个语支是如何分化的，具体语言是什么。他最大的贡献是推翻了格里姆关于古日耳曼语只有 a、i、u 三个基本元音的观点。August Schleicher的著作《印度日耳曼系语言比较语法纲要》更加重视语音发展规律，他最有名的是对古印欧语的构拟，他构拟的古印欧语有9个元音和15个辅音。[11]他是历史上第一个做比较构拟工作的学者，对历史语言学的发展做出了很大贡献。August Fick的《民族分裂前印度·日耳曼基础语词典》（1868）注重古印度语词的构拟和汇集，从第2版改名为《印度日耳曼语系语言词典》（1870—1871），第3版扩充为4册（1874—1876），第4版出版于1890年。他是首位全方位讨论印欧语言的学者，他把古印欧语分为东、西两支，欧洲语言又分为南欧、北欧、波罗的·斯拉夫、日耳曼等语，由此看出他是按照地理位置进行印欧语分类的。他对同源词的判断也是不客观的，标准就是：凡是一个词在两支语言里都可以找到，就属于共同语词汇，反之，只属于一种语言的词。很显然，这种方法极不可靠，也不科学。

意大利语言学家Graziadio Isaia Ascoli在《语言学教程》里极力反对葆朴和Schleicher认为梵语k可以代表原始印欧语的说法，他举出许多实例证明古印欧语的k不止1组，而是3组。但是他的第3组使用的例子有误，后来 Bezzenberger、Herman Osthoff和Sophus Bugge（1890）做了纠正。而丹麦哥本哈根大学教授维尔纳（Karl Verner）解决了“格里姆定律”中没有解决的问题，格里姆的例子里有很多例外，而维尔纳无意中发现那些例外词在梵语相当的词里面重音位置不同，但是到了共同日耳曼语里就消失了，因此断定，这些不同乃是古代重音位置不同造成的。维尔纳的这个重大发现使得历史语言学家们认识到，一切演变都是有规律的，如有例外，必有原因，这就是“维尔纳定律”。而Curtius的学生Karl Brugmann跟他的几个朋友组成的“新语法学派”坚持两个原则：一是语音定律没有例外，二是类推作用，进一步推进了历史比较语言学的研究。第一个原则毫无疑问与维尔纳定律表述的观点一致。第二个原则是一个巨大的革新，虽然老一派学者极力反对新语法学派的那一套，他们之间可以说是针锋相对，但是对于类推作用，他们是欢迎的，连反对他们的Curtius也很高兴。历史语言学领域最大的一次辩论发生了：一派是“新语法学派”成员 Brugmann、Osthoff等人；另一派有两个阵营，一个是他们的老师 Curtius，另一个是校外的施密特（Johannes Schmidt,Schleicher的学生）和Fick学派的Bezzenberger、Golitz，三方展开了激烈辩论。不过该学派的理论运用仅限于语音学方面，很少涉及形态学尤其是造句法方面。但是B.Delbrück稍微改变了该现状，而且Brugmann的《比较语法纲要》最后一部分造句法是由Delbrück写成的，无论在理论方面或是实践方面都比其他人前进了一步。[12]“新语法学派”是历史比较语言学发展的巅峰时期，在其之后历史语言学研究归于平静。

彼时日内瓦大学的索绪尔转学到莱比锡大学，投师于Curtius门下，起初也与新语法学派的成员经常讨论问题，1878年发表了代表作《论印欧语元音的原始系统》，文章于1879年印成单行本，他把古印欧语的四个领音元音、、、和整个元音系统都概括成一个完整的理论，巧妙地解释了印欧系语言中很难解决的a:ē:ō和a:ā:ō元音交替问题。这年他21岁。但是他在以后的岁月里再也没有发表过什么重要的文章，1913年他去世后他的学生Ch.Bally和Sechehaye根据他在日内瓦大学的讲义整理成《普通语言学教程》，该书的出版使语言学界发生了翻天覆地的变化。可以说，索绪尔的《普通语言学教程》是语言学研究领域的分水岭，在他之前是历史比较语言学的天下，人们关注语言起源及发展演化，在他之后，人们更多地关注语言本身。索绪尔的出现标志着历史语言学黄金时段的终结，人们再也看不到那种场景了：所有人都围绕各种语言的历史进行研究，心无旁骛。

索绪尔的学生梅耶（A.Meillet）也在语言学界做出了很大贡献。他著述颇丰，多与历史比较语言学相关，最有名的属《历史语言学中的比较方法》。[13]该书在历史比较语言学界引用次数最多，影响范围最广。梅耶对于历史语言学所做的一般是总结性的工作，既不抹杀前人成绩，也不忽略他们的错误。每本书都先说明有关各种语言的情况，然后分论语音、形态、句法和词汇。他的著作比较全面客观。

19世纪的历史比较语言学是德国人的天下，如格里姆、葆朴、洪堡特（W.von Humboldt）、Schleicher、施密特、Brugmann、Osthoff、S.A.Leskien、H.Paul及Delbrück等都是德国人，其他国家从事语言学工作的人或是在德国受过训，如英国的J.Wright，法国的梅耶，美国结构主义学派创始人F.Boas、S.Sapir、F.Bloomfield等，美国早期的Whitney，或是入了外国籍的德国移民，如牛津的 F.M.Müller。至于原因，恐怕与德国的历史和文化传统有关。很多世界顶尖级的哲学家、思想家都是德国人，如康德、马克思、黑格尔等。另外印欧语是研究的主要对象，从1814年拉斯克的《古代北方语或冰岛语起源研究》一直到1925年梅耶的《历史语言学中的比较方法》都以印欧语为对象，可以说印欧语是世界上研究得最为系统、最为彻底的语言。而历史语言学研究的中心是语音问题，通过语音对应探寻语音发展规律，从而确定同源关系，构拟原始印欧语。从最初的拉斯克到新语法学派，语音问题贯穿始终。拉斯克开始提出对语音规律的探索，格里姆用大量例子予以证明、归纳，进而有了“格里姆定律”，但是该定律无法解释很多例外，维尔纳继续研究，找到症结，得出了“维尔纳定律”，新语法学派借鉴生理学和心理学的研究成果，解决了语音变化的原因，强调“类推”作用的影响。这样通过一代一代人的努力，最终解决了语音规律问题。而印欧语的发生学分类也是一步一步推进的，自1863年Schleicher提出谱系树形图后，为解决该模式的不足，很多学者又提出了其他模式，如Fick的谱系树形图，Müller 的树形图，施密特的“波浪论”，以弥补Schleicher树形图的缺憾，从而使分类法更加完善。这些学者在前人的研究基础上，继续前人未完的工作，或者认为前人史料不足，理论有偏差而加以批驳。这种学术界的连续性，使历史比较语言学在19世纪末达到顶峰。即使到了1922年，发展了共时语言学的Otto Jesperson在当时弥漫着19世纪历史语言学的氛围中说，语言的研究主要是历史的研究。而20世纪初提出的一些有关语言结构的观点，最初也是用于历史语言学方面。[14]

四从同源论到亲缘度

索绪尔之后，语言学研究的重心已转移到语言的本体研究，出现了一些如结构主义语言学、转换生成语言学、功能语言学等学派，与历史语言学偏重语言的历史研究即纵向研究不同，他们重视语言的“共时”性研究即横向研究。至此，历史比较语言学被其他语言学光芒所掩盖，历史比较语言学不再是主流语言学。虽然如此，仍有一大批学者投身于该领域，但是研究的重心不再是印欧语系。

印欧语系研究的成功，使得许多人认为，历史比较法是语言比较研究放之四海而皆准的方法，殊不知，该方法运用到亚洲大陆或其他地方，却屡屡碰壁。所以找到合适的方法迫在眉睫。由于地域的特殊性、时间跨度的差异性，如果都用同源来定位很难达到理想的效果，桥本万太郎曾说：“人们把这一针对印欧语的议论，轻信为适用于人类语言科学的普遍真理、绝对真理，这就束缚了跟印欧语发展不相同的语言发展的研究。……在没有历史框框的东方，如果也有人这样看，并且把印欧语中获得成功的语言谱系研究当作唯一的方法，用以研究其他语言，我们不能不引为憾事。”“语言学家旧有的知识过分依赖印欧语的演化资料，印欧语自古以来分散到欧亚各地，很多语族各自独立发展。但是，世界上的语言并不都是这样发展起来的，尤其是东亚大陆语言的发展，基本上是由东方文化中心地的语言缓慢地同化周围语言的过程。”在此，桥本万太郎把印欧地区的语言称为“牧畜民型语言”，把亚洲地区语言称为“农耕民型语言”。作为那些完全不同于印欧语的语言，研究方法也得彻底改变，“农耕民型语言由于被其中心语言的同化和不断借用，要想阐明这种同化的组合过程，采取印欧语用过的方法，即根据比较法来构拟祖语则是非常困难的”[15]。

另外，基本词汇对应在亚洲语言里不起作用，桥本万太郎所举例子足以说明。如印欧语数词最稳定，但是在东亚，没有比数词更不稳定的了，日语11以上数词借自汉语。越南语1万以上借自汉语，朝鲜语100以上用汉语，泰语2以上都是汉语借词。还有身体部位词，如汉语方言有“眼”和“目”,“膊”和“膝”“骹”等的区别。东亚语言的抽象词汇、文化词汇都能看出它们的一致性，而被认为不易变化的亲属关系、人体名称等方面的基本词汇反倒存在差异，因为农耕民型语言逐渐被文明中心地的语言同化，导致这类词汇趋向一致。因此在印欧语系里使用的那一套标准在东亚语言里都失灵了。如何确定印欧语系之外的语言关系，使用谱系树模式是不可能的。

李葆嘉先生也说过，发端于18世纪与19世纪之交的西欧历史比较语言学，其独特的语言结构及拼音文字为其创造了得天独厚的条件，但是在随后的推进世界性语言关系研究的历史进程中，却迎来了西欧语言比较中没有出现过的问题，一方面，基于研究范围的扩大和谱系树模型的膨胀，超级语系的建构实在是传统历史比较语言学的必然，尽管持传统语言学观点的学者难以接受；另一方面，超级语系的建构浪潮势必导致历史比较语言学的研究走向实现重大突破——从语言的同源性研究转向语言的亲缘度检测。以建构祖语为目标的同源性研究重在定性，而基于相关语言要素统计的亲缘度检测重在定度。显而易见，如果仍然囿于传统的同源论研究模式或谱系树模式，一定会陷入用于比较的词语究竟是否借用的针锋相对，而亲缘度研究理念却可以避免在目前或者可能永远无法解决的问题上纠缠不清。[16]

由同源论到亲缘度的转向，是语言研究发展的必然。传统的同源假说基本上局限于印欧语系，俗称近亲关系，其他语系虽有研究但是不多，如东亚大陆、美洲大陆、非洲大陆的语言，主要在于当地经济落后，科学不发达。随着印欧语系的研究日益成熟，学者们把眼光投向世界其他地方，却发现传统的语言谱系树完全不合适，因此只有基于某一原始义项表及其他语言结构因素，依据一定的比较标准和评估程序，确定不同语言之间的亲缘梯度，即不同历史阶段和历史层次的亲属关系，才最符合语言的演化历史。[17]

“语言总是具体时空中的语言，语言之间的亲属关系具有历史阶段性，这就揭示了语言关系演变的动态性。语言亲属关系假说只能以某一具体时空为背景。历史比较语言学所关注的并非现代语言萌发和流播过程中的远亲关系，而是将研究目光聚焦于现存语言之间的近亲关系。对于绝大多数语言而言，也许可以把这一近亲关系的时空上限确定为新石器时代，即距今1万至7000年之间。但实际上难以统一，因为不同地区或不同种群进入新石器时代的时间不同。即使如此，我们仍然可以借助新石器考古遗存的不平衡，推测早期语言的分化途径和接触关系。……既然这些民族的语言文化在史前就已经彼此发生过深刻影响，因此如果限定在某一具体时空范围内，它们之间无疑具有亲属关系，准确地说，存在某种亲缘度。进而言之，在‘亲缘关系’的历史长河中可能具有两种不同的来源：一种是源于推移或分化的可追溯性‘同源亲缘’，一种是源于接触或同化的可追溯性‘接触亲缘’。与之相反，也有两种‘非亲缘关系’：一种是本非同源的‘真性异源’，一种是同源湮没的‘假性异源’。”[18]因此，在确定语言关系时，必须以具体时空为背景，方可推测语言之间的关系。而且亲属关系的认定以“亲缘度”为尺寸，有的关系较近，有的关系较远，不能以“有”或“无”亲属关系来判断。很多语言都有亲缘关系，只不过程度不同而已，即所谓的亲缘梯度。李葆嘉先生在桥本万太郎的理论基础上，进一步提出世界语言不同的关系类型：“语网”和“语珠”。牧畜民型的远距离迁徙突破原始语网，语言的分离和独立发展形成“亲缘分化型语系”；农耕民型的文化扩散突破原始语网，语言的推移和互动接触形成“地缘同化型语区”；渔猎—采集民型则滞留于“地缘连锁型语网”；海上游牧民型的迁徙不定和交往阻绝而形成的“地缘离散型语珠”。[19]

桥本万太郎和李葆嘉先生的研究已经放眼全球，当然，他们的研究主要聚焦于东亚一带的语言。其他地区的语言分类，同样纷争频起，如Headley对南亚语言分类的尝试（见图1）：

图1 Headley对南亚语言分类的尝试①

① Robert K.Headley Jr.,“Some Considerations On the Classification of Khmer”,in P.N.Jenner and et al.（eds.）,Austroasiatic Studies,Honolulu:The University Press of Hawaii,1976.

同一种南亚语言内部却有如此截然不同的分类，究其原因，是因为标准不同，第一种是基于音系特征的分类，第二种分类根据同源词比例，第三种则以词汇创新为基础。如越—芒语，假如以音系特征为基础，它和德昂语、高棉语同属一类，而如果以同源词比例为基础，则自成一支，如果基于词汇创新，则和卡都语同系。标准的不同，视角的不同，分类结果大相径庭。其他地区的语言分类，不像印欧语系内部分支那么整齐划一。总的来说，无论如何，各种语系、语言、语支之间有着错综复杂的关系，可能在某个时间段某两种语言之间存在同源关系，在另一时间段，又与其他语言同源。任何事物都在不断发展变化，语言也是如此。因此，传统的以同源性为基准的观点应该放弃，而代之以亲缘度，如此，将更符合语言变化的实际。如越南语，根据不同学者的观点，系属不同，Maspero（1883—1945）认为它属汉藏语系、壮侗语族或汉藏语系中独立的一支，施密特认为越南语属南亚语系孟—高棉语族。现代越南语言学者认为越南语属南亚语系，但最近具有民族主义倾向的越南语言学家认为还是应该列入壮侗语系。原因在于，它在不同历史时期当与不同语言同源，只不过亲缘程度不同而已。历史的真相只有一个，挖掘历史，找到真相，是目前历史语言学家最重要的任务。

李葆嘉先生深入讨论了语言分类的标准，他一方面批评前人研究的不足，认为“无论像中国学者为维护李方桂的‘汉藏语系说’所坚持的语言结构的稳定性（同构标准），还是像一些外国学者坚持把基本词汇的对应性作为唯一标准（同源标准），其实都难免流于无的放矢”，一方面，提出了自己的解决方法，认为“在语言接触过程中，语言的任何要素从来不具有什么天然的‘稳定性’，问题在于接触方式（借用—渗透—转型—换用—混合）和渗透深度（表层—底层；单层—多层）。虽然结构类型的相似性有可能出于强势语言的长期影响，但基本词汇，包括所谓的‘核心词语’也并非不可能借用，乃至大批或持续借用。依据‘无界接触观’，语言中的任何成分都可以渗透和借贷，不但结构类型和音系格局可以借贷，就是核心词汇和形态手段也同样可能借贷。西方历史比较语言学所标榜的‘语音对应规则’，除了可能是语言同源的证据，有可能是语言趋同的结果。语言接触过程中最活跃的要素是词语，其语音结构特征会对借方语言的个别音位乃至音系格局发生影响，其语义结构方式会对借方语言的语法范畴乃至结构类型产生影响。随着语言接触的深入，借方语言中的任何要素都可能发生变化即丧失其‘稳定性’。因此，判断语言亲缘关系的标准应是音系格局、基本词汇、结构类型以及文化特征的综合标准，而任何各执一端的单一标准只会引起不同看法的针锋相对”[20]。

五亲缘度的崛起：超级语系泛滥

在日本学者桥本万太郎一针见血地批评传统的印欧语系研究方法用于东方语言的不可取，指出印欧语和东亚语言的本质差异之时，美国学者格林伯格在大洋彼岸已经开始大范围地研究世界各地语言，并早已确定了非洲和印度洋—太平洋一带的语言谱系分类。如此大范围的语言分类尚属首次。后来他又对美洲大陆语言分类，把广阔的美洲语言分为三种，与当地主流语言学家把美洲语言至少分为50多种语系的观点背道而驰，在当地引起了一股反对格林伯格假说的热潮。后来他又对欧亚大陆的语言进行分类，虽然他的证据很丰富，材料也很翔实，但是一些学者在他的词汇证据里依然发现了很多借词，甚至很多错误。对他的方法论——多边比较法——也进行了有力的批判。格林伯格的分类遭到学界的放弃，最主要的原因在于他的方法论。他在给语言分类时，不顾语言材料的时间，也不管这些材料是否是偶然相似或是借词，而把大量语料置于同一个框框里，如果相同或相似便确定是同源。因为语言变化复杂，如此简单操作，学界一片声讨，自是当然。

格林伯格的分类理想引起了另外一些学者的思考，DNA 研究证据也为现代人非洲起源说提供了强有力的证据。20世纪末，Bengtson和Ruhlen在他的理论思想指导下提出了一源论的思想，他把世界语言分为12种语系：克瓦桑语系、尼日尔—科尔多凡语系、尼罗—撒哈拉语系、亚非语系、达罗毗荼语系、卡尔特维里语系、欧亚语系、德内—高加索语系、南方大语系、印度洋—太平洋语系、澳大利亚语系、美洲印第安语系。[21]在语言学界激起了更强烈的反响。

在格林伯格提出非洲语言分类之际，远在俄罗斯的两位学者斯维提奇（V.M.Illich Svitych）和多戈泊斯基（A.Dolgopolsky）重新挖掘另外一个超级语系假说——诺斯特拉语系，该语系涵盖范围非常之广，横跨欧、亚、非地区，包括印欧语系、亚非语系、卡尔特维里语、乌拉尔语系、阿尔泰语系、达罗毗荼语系。这种分类还只是斯维提奇和多戈泊斯基的想法，研究诺斯特拉语系假说的学者较多，但是观点不同，有的甚至针锋相对，最初研究该语系的学者主要集中在俄国，由于原文主要使用俄语，而翻译工作并未展开，因此熟悉这一理论的西方学者并不多。美国学者在20世纪末也开始涉足这一领域，比较著名的是伯哈德（Allan R.Bomhard），他本人对语系的假说也在不断改进，对欧亚语系的系属前后有三次不同的观点。但是他一直把欧亚语系当作诺斯特拉语系的一个分支。伯哈德在他最著名的《原始诺斯特拉语构拟》里花了7个月时间针对多戈泊斯基的《诺斯特拉语系词典》（Nostratic Dictionary）逐条分析批判，似乎该词典无一是处。[22]在该书第二卷他列出了625个原始诺斯特拉语词干，并找到了92个词源。[23]美国有一位坚定的反超级语系学者，他就是Campbell,Campbell曾极力反对格林伯格的假说，对于诺斯特拉语系也是强烈批判。他一开始就质疑该语系的名称，认为“诺斯特拉语系是个移动拼图”。随后便一一指出该语系提供的同源词问题所在。总而言之，按照他的想法，该语系从名称到方法论，都是无稽之谈。[24]

前面讨论的，学者们主要关心的是欧洲、非洲、美洲还有亚洲大陆北部的语言，但是在亚洲大陆东南部、喜马拉雅一带，还有大量语言，也有一些学者在研究。早期的杰出代表是德国学者施密特。施密特把这一带的语言统称为“南亚语系”，他是首位对该地语言研究较深入的学者。但是他的研究存在很大问题，主要表现在他对越南语地位及占语归属上，他把占语划入南亚语系，后来学者发现占语应属南岛语系。他的同源词都是随机从孟高棉语地区得来的，而非涵盖整个区域，因此许多学者对此颇有微词。但是在那个时代，能够做到这种程度，已经非常了不起。现代研究南亚语言的代表是法国学者迪夫劳斯（Gérard Diffloth）。他在《新编不列颠百科全书》1980年版上的南亚语系分类影响深远。他前后对南亚语系的分类做了五次修改，最后的一次分类包括三个语族：蒙达语族、卡西—克木语族、核心孟高棉语族。当代研究南亚语系的学者最著名的是澳大利亚学者P.Sidwell,[25]他发现了一些现已绝迹的南亚语如前占语（pre-Chamic langua ges）和亚齐语（Acehnese）。他采用词汇统计学比较法对36种语言进行比较，认为根据当时的证据，南亚语系的13个语支应该是等距的、并列的，处在同等的地位上。现如今，南亚语系内部分类依然众说纷纭。辨别几种语言的关系，确定一种语言的系属，欧洲语言相对来说比其他地方语言显得容易很多。欧洲语言的形态和语法结构较易辨别，只需辨别词汇，而其他地方的语言要复杂得多，至于南亚语系语言，更加复杂，截至目前，南亚语系的研究还不成熟，还有许多工作要做。

与南亚语言紧邻的就是南岛语言了。南岛语言是世界上唯一主要分布在岛屿上的语言，包括太平洋各大小岛屿及亚洲大陆东南部的中南半岛和印度洋一些岛屿上的语言。早期研究南岛语言的代表主要是德国哲学家和语言学家洪堡特（Wilhelm von Humboldt），德国学者施密特。洪堡特首次使用科学的证据，仔细研究了马来半岛和波利尼西亚一带九种语言的词汇表。他首次把这些语言置于一个专业术语“马来—波利尼西亚语系”（Malayo-Polynesian）之下。施密特造了一个术语“南岛语系”（Austronesian）取代了“马来—波利尼西亚语系”。Robert Blust是当代南岛语言研究者中最多产的学者。他承继了Dempwolff的研究方式，最大成就是出版了《南岛语词典》。Blust最早对南岛语的分类是在1977年，那时他把南岛语分为四类，包括泰雅语、邹语、排湾语和马—波语。马—波语进一步分为西、中、东支，大洋洲语属于东支。后来又进行了多次修改。Ross认为，台湾外的所有南岛语言都来自原始马—波语。[26]2009年，Ross根据不同台湾南岛语的形态证据提出新的南岛语系分类。他认为目前原始南岛语的构拟实际上与某个中间阶段对应，称为“原始核心南岛语（Proto-Nuclear Austronesian）”。[27]而Lawrence A.Reid却认为南岛语谱系树里需要有阿眉斯—外台湾语（Amis-Extra-Formosan）节点。[28]沙加尔（L.Sagart）对南岛语的分类与其他学者存在很大区别，他认为原始南岛语主要有两支：西北支和皮图语支。[29]台湾学者李任癸对台湾岛上的南岛语进行了分类。他在分类中保留了Blust的东支，其他北支则合并在一起。[30]

还有学者对南岛语系与其他语言的同源关系进行研究，主要有以下八种：澳泰语系（Austro-Tai）、日—澳泰语系、汉—南岛语系、南方大语系（Austric）、南岛—印欧语系、南岛—闪语系、南岛—美洲印第安语系、翁干—南岛语系。

截至目前，学者们所提供的资料都存在这样那样的问题，各个学者之间针锋相对，互相指责。以上有关语系内部任一假说或几个假说的结合最终有可能被证明是正确的。但是，就目前的证据来看，有关南岛语言外部关系的假说仍有待证明。

有学者认为南亚语系、南岛语系构成一个更大的“南方大语系”。对它的研究，历史不长，观点不一，争议很大。早期的主要代表依然是施密特，他创造了术语“南方大语系”（Austric，来自拉丁语 auster“南方”），在他的专著《孟高棉人群——中亚人和南岛人之间的连接》里非常自信地论证了南亚和南岛语系之间的同源关系，但是多数学者持反对态度。Paul Benedict在他的澳泰语系里放弃了南亚语系。当代一些学者仍然坚持南亚语和南岛语的发生学关系，并找出了大量的词汇、语法证据，如迪夫劳斯（Gérald Diffloth）、Reid、Hayes等。迪夫劳斯除了在南亚语系领域所做出的巨大贡献外，在南方大语系假说论证方面也是功不可没。他对前人的研究进行了批判，如施密特和Benedict，另外他自己也提出了词汇证据。不过他还是很谦虚地说道：“目前我们离此还很遥远，我们已做的只不过是盲人摸象，然后说那里好像有一个类似什么的东西。”Reid考证了南考里语，他认为南考里语是南亚语，并与南岛语同源。并且提出了一系列形态证据证明南亚语与南岛语同源。不过这些证据并非实质性的、有价值的。Hayes提出了南亚—南岛语系词汇关系不同的观点，他认为这些是“无可辩驳的南方大语系假说的证据”。而Blust却认为他们“只不过是一堆随机收集的物品”。因此南方大语系假说至今还未定论。虽然如此，一些学者在此基础上，仓促提出了更大的语系。如Bengtson的超大南方大语系（Greater Austric）包括尼哈里语、南亚语（蒙达—孟高棉语）、宏勉语（苗瑶语）、台语（台—卡岱语）、南岛语、阿依努语。Blevins把原始翁干语作为南岛语的姊妹语，也遭到一些学者的指责。南方大语系至今疑点重重，很难使人相信它是否真正存在。

以上种种超级语系，都是建立在内部各种语言之间有亲有疏的基础之上，语系内部的语言并非处于同一地位，有些语言虽然和其他语言都属一个语系，但是由于社会的发展、历史的演变、地理位置的影响，它和A语言关系紧密一些，与B语言关系疏远一些，即该语言与A语言亲缘度高，而与B语言亲缘度低，因此亲缘度的使用更加符合语言实际。

六同源论到亲缘度，历史的必然

虽然目前各个学者还在努力论证各种语言之间的同源关系，但在充分证明了某些语言的同源关系之后，他们下一步要做的是，如何证明更大范围语言之间的关系，仅仅使用同源已无法满足各种语言的关系，特别是一源论的提出，如果仅仅认为各种语言同源，那就不能如实反映语言的真实情况，揭示语言的发展演变规律，因为各种语言之间并非仅仅同源那么简单，而是亲疏有别。

一源论早在20世纪初就已经由意大利语言学家Trombetti提出来了。他在1905年发表的一本著作《论语言来源的统一性》（L'unita d'origine del linguaggio）中，通过比较各种语言中的词根（词汇的和语法的）证明世界语言同出一源。

半个世纪后即1954年，Swadesh再次提出一源论的主张。他比较了新旧大陆的各个语系，认为很多语系之间是可以证明存在遥远亲缘关系的，因而可以把它们合并为更大范围的超级语系。同样，这些超级语系之间也可能有更为遥远的亲缘关系，最终世界所有语言之间都可能有亲缘关系，即同出一源。

1987年美国加州大学伯克利分校 Wilson 小组的科学家 Rebecca L.Cam等人，通过研究世界各地现代人类的DNA，认为现代人源于15万—12万年前生活在东非的同一个聚落的共同祖先。由中国国家自然科学基金资助，中国研究机构和美国得克萨斯大学遗传研究中心1998年9月29日发表于美国国家科学院的学报上的研究结论：“东亚人口的遗传标记大都相同，这表明他们起源于共同的祖先，现在我们可以肯定地做出结论，东亚人口的大多数起源于非洲。”

Aitchison在《言语的萌发：语言的起源与进化》一书中对人类语言起源的时间推测：“最早的估计是25万年前，平均估计是10万年前，最晚是5万年前。”那么在现代人走出非洲之前，原始语言极可能已经形成，假若这个假设成立的话，那么当今全世界语言应该有共同的原始祖语，有一些共同的词根。反过来说，若能在当今全世界的语言中找到共同的词根，也就证明了“当今全人类共同的祖先在分散世界各地前已有原始语言”这个命题。[31]

根据格林伯格以及其他学者对各大洲语言的分类学和历史比较研究，世界上的大约5000种现存语言可以归入12个远古语族。Ruhlen在这12个语族的基础上更进一步，他通过比较这些语族各自存留下来的同源词，发现至少有几十个词根广泛存在于这些不同语族中。

美国遗传学家Cavalli-Sforza指出，根据生物学特征进行的人类谱系分类同语言学家建立的语言谱系分类十分接近。[32]

1991年，苏联语言学家 A.Melnichuk 为一源论提出了重要的新证据。他根据印欧语语源学研究的最新成果对世界各个语系进行了考察，指出最初本为印欧语建立的一些词源群同样也可以在几乎所有别的语系中找到。这些词源群不仅有语义上的相关，而且在语音上可归结到相同的来源。此外，这些词源群在不同语系之间表现出一些共同的结构特点，进一步证明各个不同的语系是同出一源的。

周流溪根据前人的研究，把世界语言演化发展列图如下（见图2）。

Ruhlen认为所有这些证据，包括语言学的和来自别的学科的，已足以证明一切语言之间都有亲缘关系，世界语言同出一源。他指出，今天学者们的任务已不再是考察这些语言或语系之间有无亲缘关系，而是弄清其间亲缘关系的程度。[33]

截至目前，放眼世界语言关系，依然扑朔迷离。但是不带偏见地说，一些语言学证据和其他领域的证据已经确凿无疑地告诉我们，世界语言源自同一语言，非洲是世界语言的发源地。因此，现阶段历史语言学家的主要任务就是证明各种语言之间亲缘关系的程度，而如何证明这种程度却是非常困难。

图2 周流溪的世界语言演化发展图①

① 周流溪：《“语言起源的一源论”书后》,《外语教学与研究》1994年第2期。

[1]G.E.Guhrauer,Life of Godfrey William Von Leibnitz,Kessinger Publisher,1845,p.127.

[2]Court de Gebelin,Monde Primitif,Analyse et Compare avec le Monde Moderne,Charleston:Nabu Press,2012.

[3]Lorenzo Hervasy Panduro,Catalogope de las Lenguas,Madrid,1800.

[4]Johann Christoph Adelung,Mitridater Soder Allegmeine Sprachenkunde,Construction Technology,1970.

[5]R.H.Robins,A Short History of Linguistics,Addison Wesley Longman Limited,1997,p.164.

[6]Friedrich von Schlegel,Über die sprache und Weisheit der Inder,Heidelberg:Mohn and Zimmer,1808,p.28.

[7]R.H.Robins,A Short History of Linguistics,Addison Wesley Longman Limited,1997.

[8]岑麒祥：《语言学史概要》，世界图书出版公司2008年版，第104页。

[9]Jacob Grimm,Deutsche Grammatik,Gottingen:Dietrich,1819.

[10]August F.Pott,Etymologische Forschungen auf dem Gebiete der Indogermanischen Sprachen,Lemgo:Meyer,1833-1836.

[11]August Schleicher,Compendium der Vergleichenden Grammatik der Indogermanischen,Weimar:Böhlau,1871.

[12]岑麟祥：《语言学史概要》，世界图书出版公司2008年版，第120、123页。

[13]Antoine Meillet,La Méthode Comparative en Linguistique Historique,Oslo:Klincksieck,1925.

[14]R.H.Robins,A Short History of Linguistics,Addison Wesley Longman Limited,1997.

[15][日]桥本万太郎：《语言地理类型学》，余志鸿译，世界图书出版公司2008年版，第4页。

[16]李葆嘉：《从同源性到亲缘度：历史比较语言学的重大转折》，载[美]王士元主编《汉语的祖先》，李葆嘉等译，中华书局2005年版，第97页。

[17]李葆嘉：《从同源性到亲缘度：历史比较语言学的重大转折》，载[美]王士元主编《汉语的祖先》，李葆嘉等译，中华书局2005年版，第67页。

[18]李葆嘉：《从同源性到亲缘度：历史比较语言学的重大转折》，载[美]王士元主编《汉语的祖先》，李葆嘉等译，中华书局2005年版，第67页。

[19]李葆嘉：《从同源性到亲缘度：历史比较语言学的重大转折》，载[美]王士元主编《汉语的祖先》，李葆嘉等译，中华书局2005年版，第65页。

[20]李葆嘉：《从同源性到亲缘度：历史比较语言学的重大转折》，载[美]王士元主编《汉语的祖先》，李葆嘉等译，中华书局2005年版，第70页。

[21]J.D.Bengtson and M.Ruhlen,Global Etymologies,On the Origin of Languages:Studies in Linguistic Taxonomy,Merritt Ruhlen（ed.）,Stanford:Stanford University Press,1994,pp.277-336.

[22]A.R.Bomhard,“Recent Trends in Nostratic Comparative Linguistics”,Bulletin of the Georgian National Academy of Sciences,Vol.2（4）,2008,pp.387-391.

[23]A.R.Bomhard,The Nostratic Hypothesis in 2011:Trends and Issues,Washington,D.C:Institute for the Study of Man,2011.

[24]L.Campbell,Historical Linguistics:An Introduction,Edinburgh:Edinburgh University Press,1998.

[25]P.Sidwell,Classifying the Austroasiatic Languages:History and State of the Art,Munich:Lincom Europa,2009.

[26]Malcolm D.Ross,“Some Current Issues in Austronesian Linguistics”,in Darrell T.Tryon（ed.）,Comparative Austronesian Dictionary,Berlin:Mouton de Gruyter,1994,pp.45-120.

[27]M.Ross,“Proto-Austronesian Verbal Morphology:Area Appraisal”,in A.Adelaar and A.Pawley（eds.）,Austronesian Historical Linguistics and Culture History:A Festschrift for Robert Blust,Canberra:Pacific Linguistics,2009,pp.295-326.

[28]Lawrence A.Reid,“The Demise of Proto-Philippines”,Papers from the Third International Conference on Austronesian Linguistics,Canberra:The Australian National University,Vol.2,1982,pp.201-216.

[29]L.Sagart,“The Higher Phylogeny of Austronesian and the Position of Tai-Kadai”,Oceanic Linguistics,Vol.43,2004,pp.411-440.

[30]Jen-kuei Li Paul,“Time Perspective of Formosan Aborigines”,in Sanchez-Mazas,Alicia（ed.）,Past Human Migrations in East Asia:Matching Archaeology,Linguistics and Genetics,Taylor&Francis U.S.,2008.

[31][英]艾奇逊：《言语的萌发：语言的起源与进化》，外语教学与研究出版社2002年版。

[32]L.L.Cavalli-Sforza et al.,“Reconstruction of Human Evolution:Bringing together Genetic,Archaeological and Linguistic Data”,Proceedings of the National Academy of Sciences,Vol.85,1988,pp.6002-6006.

[33]M.Ruhlen,The Origin of Language:Tracing the Evolution of the Mother Tongue,New York:John Wiley & Sons,1994.

本周热推：

今日简史：人类命运大议题隋唐制度渊源略论稿·唐代政治史述论稿（陈寅恪合集：史集）但问旗民：清代的法律与社会（精装）暴力：思无所限南北战争三百年：中国4—6世纪的军事与政权

绪论 历史比较语言学理论的发展：从同源论到亲缘度

绪论历史比较语言学理论的发展：从同源论到亲缘度