Les langues humaines sont reconnues pour leur grande complexité, et les linguistes ont longtemps cru qu’il serait impossible d’apprendre à une machine à analyser le son des paroles et la structure des mots comme le font les humains. Mais voilà que des chercheurs de l’Université McGill, du Massachusetts Institute of Technology (MIT) et de l’Université Cornell ont réalisé des avancées en ce sens. Ils ont mis au point un système d’intelligence artificielle (IA) capable d’apprendre seul les règles et les structures des langues humaines.
Leur modèle apprend automatiquement les structures linguistiques générales qui s’appliquent à une langue et parvient ainsi à de meilleurs résultats. Lorsqu’on lui donne un mot ainsi que quelques-unes de ses variantes, en fonction par exemple du temps de verbe, du cas ou du genre, ce modèle d’apprentissage machine établit une règle qui explique ces différents accords. À titre d’exemple, il pourrait apprendre qu’il faut ajouter la lettre a à la fin d’un mot pour féminiser un mot masculin en langue serbo-croate.
Selon les chercheurs, ce système pourrait servir à tester des théories du langage et à étudier les ressemblances subtiles entre les langues en ce qui a trait à la transformation des mots. « Nous voulions voir s’il était possible de reproduire les types d’apprentissages et de raisonnements dont sont capables les humains », indique Adam Albright, coauteur et professeur de linguistique à MIT.
« Ces résultats sont très intéressants parce qu’ils montrent qu’on peut mettre au point un algorithme capable de généraliser à partir de minuscules échantillons de données langagières, comme le feraient des scientifiques ou des enfants », dit Timothy O’Donnell, auteur en chef, professeur adjoint au Département de linguistique de l’Université McGill et titulaire d’une chaire en intelligence artificielle Canada-CIFAR à Mila, l’Institut québécois d’intelligence artificielle.
Avec des fichiers du MIT News Office
L'étude
L’article « Synthesizing theories of human language with Bayesian program induction », par Kevin Ellis et coll., a été publié dans Nature Communications.
Journal
Nature Communications
Method of Research
Computational simulation/modeling
Subject of Research
Not applicable
Article Title
Synthesizing theories of human language with Bayesian program induction
Article Publication Date
30-Aug-2022