L’année passée a été marquée par des avancées majeures dans le domaine des grands modèles de langage (GML), comme ChatGPT. La capacité de tels modèles pour déchiffrer et produire des textes lisibles (et d’autres données séquentielles) a des implications directes dans de multiples sphères de l’activité humaine. Un nouvel article d’opinion publié dans la revue Neuron affirme que, comme de nombreux professionnels, les neuroscientifiques ont intérêt à tirer parti d’un partenariat avec ces outils puissants au risque d’être laissés pour compte.
Lors de précédentes investigations, les auteurs ont démontré que d’importantes conditions préalables sont réunies pour développer des GML capables d’interpréter et d’analyser des données neuroscientifiques comme ChatGPT déchiffre le langage. Ces modèles d’IA peuvent être construits pour analyser de nombreux types de données, entre autres en neuro-imagerie, génétique, génomique unicellulaire et même des rapports cliniques manuscrits.
Dans le modèle de recherche classique, un scientifique étudie les données antérieures sur un sujet, élabore de nouvelles hypothèses et les teste au cours d’expériences. Les énormes quantités de données existantes obligent souvent les scientifiques à se concentrer sur un domaine de recherche bien délimité, telles que la neuro-imagerie ou la génétique. En revanche, les GML sont dotés d’une capacité très supérieure à celle des êtres humains pour absorber des recherches neuroscientifiques. Dans leur article publié dans Neuron, les auteurs soutiennent qu’un jour les GML spécialisés dans divers domaines des neurosciences pourront communiquer entre eux en vue de combler les lacunes de la recherche en neurosciences afin de découvrir des réalités impossibles à trouver pour les humains seuls. En prenant l’exemple de la mise au point de médicaments, on pourrait associer un GML spécialisé en génétique et un autre spécialisé en neuro-imagerie pour découvrir des molécules candidates prometteuses en vue de stopper la neurodégénérescence. Le neuroscientifique qui dirige ces GML vérifiera leurs résultats.
L’auteur principal, Danilo Bzdok, évoque la possibilité que, dans certains cas, l’investigateur ne soit pas toujours en mesure de s’expliquer pleinement le mécanisme qui sous-tend les processus biologiques découverts par ces GML.
« Nous devons admettre que nous ignorons encore certains phénomènes concernant le cerveau, ou du moins qu’il nous faudra beaucoup de temps pour les appréhender, précise-t-il. Cela ne nous empêche cependant pas d’appliquer les connaissances fournies par les GML les plus performants et de réaliser des progrès cliniques, même sans comprendre complètement comment ils parviennent à leurs conclusions. »
Dans le domaine des neurosciences, pour utiliser les GML à leur plein potentiel, M. Bzdok estime que les chercheurs auront besoin d’une infrastructure de traitement et de stockage des données bien supérieure à celle dont disposent aujourd’hui de nombreux centres de recherche. Qui plus est, un virage culturel s’impose pour s’orienter sur une approche scientifique beaucoup plus axée sur les données, où les études, fondées grandement sur l’intelligence artificielle et les GML, sont publiées par des revues de renom et financées par des organismes publics. Le modèle traditionnel en recherche reposant sur les hypothèses reste essentiel et ne disparaîtra pas, toutefois, M. Bzdok considère que l’exploitation des technologies émergentes des GML donnera une forte impulsion à la prochaine génération de traitements neurologiques dans les cas où l’ancien modèle n’a pas été fructueux.
Pour citer John Naisbitt, les neuroscientifiques d’aujourd’hui sont « noyés sous l’information, mais affamés de connaissances », fait-il remarquer. « Notre capacité à produire des données biomoléculaires éclipse notre compréhension de ces systèmes. Les GML offrent une réponse à un tel problème. Ils pourraient être en mesure d’extraire, de mettre en synergie et de synthétiser les connaissances issues de l’ensemble des domaines neuroscientifiques, une tâche possiblement susceptible de dépasser l’entendement humain. »
Le Neuro
L’Institut-Hôpital neurologique de Montréal, ou tout simplement le Neuro, est un établissement bilingue, de calibre mondial dédié à la recherche sur le cerveau et aux traitements de pointe. Fondé en 1934 par un éminent neurochirurgien, le Dr Wilder Penfield, il est parvenu au premier rang des centres cliniques et de recherche spécialisés en neurosciences au Canada et se classe parmi les plus importants dans le monde. L’intégration harmonieuse de la recherche, des soins aux patients et de la formation de brillants scientifiques, positionne avantageusement le Neuro au plan international pour intervenir de façon décisive dans la compréhension des troubles neurologiques et leur traitement. Premier établissement universitaire au monde à adopter complètement la science ouverte, il parvient ainsi à accélérer la création du savoir et la découverte de nouvelles options thérapeutiques efficaces pour les affections cérébrales. En tant qu’institut de recherche et d’enseignement, le Neuro relève de l’Université McGill et il assume la Mission en neurosciences du Centre universitaire de santé McGill. Pour de plus amples renseignements, veuillez consulter le site www.leneuro.ca
Journal
Neuron
Method of Research
Commentary/editorial
Subject of Research
Not applicable
Article Title
Data science opportunities of large-language models for neuroscience and biomedicine
Article Publication Date
9-Feb-2024
COI Statement
Four co-authors are employees at MindState Design Labs (AT, OL, PW, TR) and five equity holders (DB, AT, OL, PW, TR).