汉藏语系包含早期有文字的语言,如汉语、藏语和缅甸语,并囊括了在中国、印度、缅甸和尼泊尔使用的超过400种现代语言,更是世界上最繁复多样的语系之一,拥有14亿母语者。尽管这一语系在19世纪初就已经被研究,但是学者们对于该语系起源的认识仍旧十分有限。由法国东亚语言研究所、德国马克斯普朗克人类历史科学研究所以及巴黎决策数学研究所组成的科学家团队在《美国国家科学院院刊》刊出一项最新的跨学科研究成果,揭示了汉藏语起源的时间和地点。该项目用系统发生学的研究方法,考察了50种古代与现代的汉藏语,得出了汉藏语起源于7200年前,中国北部种植粟的务农先民之中的结论。
过去的一万年见证了世界上两个最大语系的出现,一个在亚欧大陆的西端,另一个在其东端。两个语系语言的使用者占据了世界上超过60%的人口:印欧语系拥有32亿使用者,汉藏语系则有14亿。汉藏语系使用范围之广泛,从太平洋西岸起,可延伸至尼泊尔、印度和巴基斯坦。这些语言的使用者在人类史前史中扮演了举足轻重的角色,他们发展出了汉、藏、缅甸和尼泊尔光辉灿烂的古老文化。考古基因学家、系统发生学家和语言学家已经对印欧语系的起源进行过充分的探讨,然而汉藏语系的组成在此之前却甚少引起重视。
世界上多样性最高的语系之一
�汉藏语系是世界上多样性最高的语系之一。它包括了所有的形态系统类型,从孤立语,如汉语、缅甸语和土家语,到多式综合语,如嘉绒语组语言、基兰梯诸语。�论文的第一作者之一,法国东亚语言研究所的向柏霖(Guillaume Jacques)解释道,�虽然我们对于汉藏语系语言的比较的认识逐渐加深,但是它们的语音系统和语法的发展历程中,有许多重要的方面仍旧未被充分了解。�
五十种汉藏语言的核心词汇数据库
为了揭开汉藏语系复杂的历史,学者们建立了一个由50种汉藏语系语言的核心词汇构成的数据库。这一首次发表的数据库包含了一千多年前的古代语言,如上古汉语、古缅语、古藏语以及通过田野调查收集的现代语言的一手语料。
�为了以清晰透明的方式比较这些语言,我们研发了一套有针对性的标注方法,这种方法不仅可以标记拥有共同来源的词,而且可以标记哪些音是相互联系的。�项目主持人,来自马克斯普朗克人类历史科学研究所的游函(Johann-Mattis List)说。�辨别真正同源词的一大难点就是这些语言经常互相借用词汇。�向柏霖提道,�幸运的是,我们对某些语言的历史了解得比较全面,并且可以依赖我们研发的方法来揭开隐藏在这些借词中的历史。�
语言演化谱系树显示汉藏语系起源于7200年前
运用强大的系统发生学算法,该团队推测出了该语系语言之间最可能的历史关系,并估测了这些语言产生的年代。�我们找到了七个主要分支的有力证据,在此层面之外,还伴有不少复杂的结构和重叠的信号。�马克斯普朗克人类历史科学研究所的Simon J. Greehill说,�我们估计汉藏语系的祖先大约在7200年前出现。�
农学分析揭示汉藏语系最可能的起源与扩张模式
为了更进一步地解决汉藏语系复杂的演化历程,团队成员考察了农耕家庭的相关词汇,因为这些词汇可以揭示农耕知识如何在这一地区传播。农学分析显示汉藏语系起源于新石器时代中国北部,晚期磁山文化和早期仰韶文化种植粟的农耕民族中。�这些语言最可能的扩张应该是由东西两支的分裂开始的模式,东支是汉语民族的祖先,而西支则是操其它汉藏语系语言的民族的祖先。�论文的第一作者之一,农学分析的主持者,法国东亚语言研究中心的沙加尔(Laurent Sagart)总结道。
�我们对我们的发现感到非常振奋。�游函说。�我们的研究结合了传统严谨的研究方法以及尖端的计算方法,在计算机协助的框架下,这个项目使我们对今天语言的知识成为了解它们历史的一把钥匙。�
###
Journal
Proceedings of the National Academy of Sciences