La famille des langues sino-tibétaines comprend des langues littéraires anciennes, comme le chinois, le tibétain et le birman, et est représentée par plus de 400 langues modernes parlées en Chine, en Inde, en Birmanie et au Népal. C'est l'une des familles de langues les plus diverses au monde, parlée par 1,4 milliard de locuteurs. Bien que la famille linguistique soit étudiée depuis le début du XIXe siècle, les connaissances des chercheurs sur son origine sont encore très limitées.
Au cours des 10 000 dernières années, les deux des plus grandes familles linguistiques du monde sont apparues, l'une à l'ouest et l'autre à l'est de l'Eurasie. Ensemble, elles représentent près de 60 % de la population mondiale : l'indo-européen (3,2 milliards de locuteurs) et le sino-tibétain (1,4 milliard). La famille sino-tibétaine comprend environ 500 langues parlées dans un large éventail géographique, de la côte ouest du Pacifique au Népal, en Inde et au Pakistan. Les locuteurs de ces langues ont joué un rôle majeur dans la préhistoire humaine, donnant naissance à la Chine, au Tibet, à la Birmanie et au Népal. Cependant, alors que les archéogénéticiens, les phylogénéticiens et les linguistes ont discuté avec énergie des origines de la famille des langues indo-européennes, la formation des langues sino-tibétaines n'a reçu que peu d'attention par le passé.
Une étude interdisciplinaire publiée dans les PNAS, menée par des scientifiques du Centre des Recherches Linguistiques sur l'Asie Orientale (Paris), de l'Institut Max Planck des Sciences de l'Histoire humaine (Iéna) et du Centre de Recherches en Mathématiques de la Décision (Paris), apporte un éclairage nouveau sur le lieu et la date d'origine de cette famille. Sur la base d'une étude phylogénétique de 50 langues sino-tibétaines anciennes et modernes, les chercheurs concluent que l'ancêtre commun de ces langues était parlé des cultivateurs du millet, situés au nord de la Chine, il y a environ 7 200 ans.
L'une des familles de langues les plus diversifiées au monde
"La famille linguistique sino-tibétaine est l'une des familles les plus diverses au monde. Elle englobe tous les types de systèmes morphologiques, allant des langues isolantes, comme le chinois, le birman et le tujia, aux langues polysynthétiques, comme le gyalrongic et le kiranti ", explique Guillaume Jacques du Centre de Recherches Linguistiques sur l'Asie Orientale, co-premier auteur de cette étude. "Bien que nos connaissances sur la façon de comparer linguistiquement ces langues s'améliorent, des aspects importants du développement de leurs systèmes de sonorisation et de leur grammaire restent mal compris."
Une base de données de mots clés de 50 langues sino-tibétaines
Afin de faire la lumière sur l'histoire complexe de ces langues, les chercheurs ont constitué une base de données lexicales contenant le vocabulaire de base de 50 langues sino-tibétaines. Cette base de données, rendue accessible pour la première fois, comprend des langues anciennes parlées il y a 1000 ans et plus, comme le chinois archaïque, le vieux birman et le vieux tibétain, ainsi que des langues modernes documentées par des travaux de terrain.
"Afin de comparer ces langues de manière transparente, nous avons développé un cadre d'annotation spécifique qui nous permet non seulement de marquer les mots que nous identifions comme partageant une origine commune, mais aussi les sons qui se correspondent d'une langue à l'autre à l'intérieur de ces mots", explique Johann-Mattis List de l'Institut Max-Planck pour la science de l'histoire humaine, qui a dirigé cette étude. "Les nombreux cas où les langues se sont emprunté des mots les unes aux autres ont posé un problème particulier dans l'identification des mots réellement hérités de la langue ancestrale, " mentionne Jacques. "Heureusement, nous connaissons assez bien l'histoire de certaines langues et nous sommes à même de nous appuyer sur des techniques que nous avons développées précédemment pour révéler l'histoire qui se cache derrière ces emprunts."
Les arbres évolutifs suggèrent que la famille linguistique est née il y a environ 7200 ans.
À l'aide de puissantes méthodes phylogénétiques computationnelles, l'équipe a déduit les relations de parenté les plus probables entre langues, pour ensuite estimer leur date d'origine. "Nous trouvons des preuves claires de l'existence de sept sous-groupes majeurs, avec un schéma complexe de signaux se chevauchant aux époques plus anciennes", dit Simon J. Greenhill de l'institut Max-Planck pour la science de l'histoire humaine. "Nos estimations suggèrent que la langue ancestrale est apparue il y a environ 7 200 ans.
Une analyse agricole révèle le scénario d'origine et d'expansion le plus probable de la famille linguistique.
Pour mieux résoudre les voies complexes de l'évolution des langues sino-tibétaines, les auteurs se sont penchés sur les mots apparentés désignant les espèces domestiquées dans les langues sino-tibétaines. En effet, ces termes ont le potentiel de révéler les circonstances de la naissance de la famille, et les chemins de son expansion dans la région. L'analyse suggère que la famille sino-tibétaine trouve son origine dans les communautés de cultivateurs de millet des cultures néolithiques de Cishan et de Yangshao en Chine du nord. "Le scénario d'expansion le plus probable implique une première séparation entre un groupe oriental, à partir duquel le chinois a évolué, et un groupe occidental, ancestral aux autres langues sino-tibétaines ", résume Laurent Sagart du Centre des Recherches Linguistiques sur l'Asie Orientale, co-premier auteur de l'étude, qui a réalisé l'analyse agricole.
"Nous sommes très enthousiasmés par nos résultats ", dit List. "Notre approche associe des connaissances traditionnelles solides à des méthodes informatiques de pointe dans un cadre assisté par ordinateur. Ceci nous permet d'utiliser nos connaissances sur les langues modernes comme clé de leur passé."
###
Journal
Proceedings of the National Academy of Sciences