A família de línguas sino-tibetanas, a qual inclui algumas das primeiras línguas literárias como o chinês, o tibetano e o birmanês, é composta por mais de 400 línguas modernas faladas na China, na Índia, na Birmânia e no Nepal. É uma das famílias linguísticas mais diversas do mundo, com 1,4 bilhão de falantes. Embora venha sendo estudada desde o início do século XIX, o conhecimento dos pesquisadores sobre a origem dessas línguas ainda é severamente limitado. Um estudo interdisciplinar publicado na PNAS, liderado por cientistas do Centro de Pesquisas Linguísticas para a Ásia Oriental (Paris), o Instituto Max Planck para a Ciência da História Humana (Jena), e o Centro de Pesquisas em Matemática da Decisão (Paris), lança uma nova luz sobre o lugar e época de origem dessas línguas. Com base em um estudo filogenético de 50 línguas sino-tibetanas antigas e modernas, os estudiosos concluíram que as línguas sino-tibetanas se originaram entre agricultores de milhete (painço) no norte da China há cerca de 7.200 anos.
Durante os últimos 10.000 anos, duas das maiores famílias de línguas do mundo surgiram, uma no oeste e uma no leste da Eurásia. Juntas, essas famílias representam quase 60% da população mundial: a indo-europeia (3,2 bilhões de falantes) e a sino-tibetana (1,4 bilhão). A família sino-tibetana compreende cerca de 500 línguas faladas em uma ampla faixa geográfica, da costa oeste do Pacífico ao Nepal, Índia e Paquistão. Os falantes dessas línguas desempenharam um papel importante na pré-história humana, dando origem às primeiras culturas elevadas, como a chinesa, a tibetana, a birmanense e a nepalês. No entanto, apesar de arqueogeneticistas, filogeneticistas e linguistas terem discutido energicamente as origens da família das línguas indo-européias, a formação das línguas sino-tibetanas recebeu até hoje pouca atenção.
Uma entre as mais diversas famílias linguísticas do mundo
A família sino-tibetana é uma das famílias mais diversas do mundo. Ela inclui todos os diferentes tipos de sistemas morfológicos, de línguas isolantes, como o chinês, o birmanês e o tujiano, até línguas polissintéticas, como as línguas guialrongicas e quirantes, explica Guillaume Jacques, do Centro de Pesquisas Linguísticas para a Ásia Oriental, co-primeiro autor do estudo. "Embora nosso conhecimento sobre como comparar linguisticamente essas línguas esteja melhorando, aspectos importantes do desenvolvimento de seus sistemas fonológicos e de suas gramáticas permanecem pouco compreendidos."
Um banco de dados com palavras nucleares em 50 línguas sino-tibetanas
A fim de lançar luz sobre a complexa história dessas línguas, os pesquisadores montaram um banco de dados lexicais contendo o vocabulário nuclear de 50 línguas sino-tibetanas. Esta base de dados, agora publicada pela primeira vez, inclui línguas antigas faladas há 1000 anos ou mais, como o chinês antigo, o birmanês antigo e o tibetano antigo, bem como línguas modernas documentadas pelo trabalho de campo.
Para comparar essas línguas de maneira transparente, desenvolvemos uma estrutura de anotação específica que nos permite não apenas marcar quais palavras identificamos como compartilhando uma origem comum, mas também quais sons nessas palavras acreditamos que estejam relacionados, diz Johann-Mattis List do Instituto Max Planck para a Ciência da História Humana, que liderou o estudo. Um problema particular na identificação das palavras verdadeiramente relacionadas foram os numerosos casos em que as línguas emprestavam palavras umas às outras, menciona Jacques. "Felizmente, conhecemos bem a história de determinadas línguas e podemos confiar em técnicas que desenvolvemos anteriormente para revelar a história efetiva, ocultada por esses empréstimos."
Árvores evolutivas sugerem que a família teve origem há cerca de 7200 anos
Usando poderosos métodos de filogenética computacional, a equipe inferiu as relações mais prováveis entre essas línguas e, em seguida, estimou quando a origem das mesmas poderia ter se dado. "Encontramos evidências claras de sete subgrupos principais, com um complexo padrão de sobreposição de sinais abaixo desse nível", diz Simon J. Greenhill, do Instituto Max Planck para a Ciência da História Humana. "Nossas estimativas sugerem que a língua ancestral surgiu há cerca de 7.200 anos".
Uma análise agrícola revela o cenário de origem e expansão mais provável da família linguística
Buscando solucionar os complexos caminhos da evolução das línguas sino-tibetanas, os autores analisaram palavras relacionadas com a domesticação, visto poderem revelar como o conhecimento agrícola se espalhou pela região. Esta análise agrícola sugeriu uma origem da família sino-tibetana nas comunidades do norte da China de agricultores de milheto (painço) das culturas neolíticas do final da época Cishan e do início da época Yangshao. "O cenário de expansão mais provável das línguas envolve uma separação inicial entre um grupo oriental, a partir do qual evoluíram os dialetos chineses, e um grupo ocidental, que é o ancestral do restante das línguas sino-tibetanas", resume Laurent Sagart, do Centro de Pesquisas Linguísticas para a Ásia Oriental, co-primeiro autor do estudo e responsável pela análise agrícola.
"Estamos muito animados com nossas descobertas", afirma List. "Nossa abordagem combina robustas abordagens tradicionais com métodos computacionais de ponta, no contexto de uma estrutura assistida por computador que permite usar nosso conhecimento sobre línguas atuais como uma chave para o passado das mesmas."
###
Journal
Proceedings of the National Academy of Sciences