News Release

言語研究用のアルゴリズムがSARS-CoV-2などのウイルスの「エスケープ」変異を予測する

Peer-Reviewed Publication

American Association for the Advancement of Science (AAAS)

ヒト言語およびウイルス進化という異なる概念を結びつけることで、研究者らは、ウイルスがヒト免疫系やワクチンの作用を「エスケープ」することを可能にする変異を予測する新たな強力なツールを開発した。これを使用することで、ウイルスが免疫による認識をエスケープすることを可能にする可能性のある変異を同定するために現在用いられている、ハイスループットの実験技術を使用しないですむと考えられる。「著者らは、ウイルスと宿主の免疫系によるその解釈に認められる性質と、自然言語の文章とヒトによるその解釈に認められる性質との間にある並行関係を明かにした」と、Yoo-Ah KimとTeresa Przytyckaは関連するPerspectiveで記している。時によって、ウイルスはヒトの免疫系を回避して感染を引き起こすという、ウイルスエスケープとしても知られる挙動を可能にする変異をきたすことがある。ウイルスのこのような能力は、特に万能インフルエンザワクチンやHIV感染症に対する効果的な治療の開発において、大きな課題となっている。さらに、ウイルスエスケープはSARS-CoV-2感染症に対する解決法の開発競争において、速やかに緊急の懸念となっている。エスケープ変異を支配する規則を理解することは治療薬のデザインにとって重要な情報を与えられると考えられる一方で、可能性のあるエスケープ変異を同定するための現在の技術には限界がある。Brian Hieらは、文法(統語論)と意味(意味論)という言語学の概念からヒントを得て、自然言語処理、すなわち機械学習という、そもそもはヒト言語の理解をするよう単語の連なりを用いてコンピュータを訓練するために開発された技術を、アミノ酸配列を用いて、ウイルスエスケープにつながり得る変異を予測することに応用した。どのように単語が変化すれば文法に従いながら文章の意味が変化するのかと同様に、Hieらは、ウイルスの感染性を支配する生物学的な「統語論」を維持しながら、ウイルスの「意味論」を変化させることで中和抗体による認識を回避するような変異によって、いかにエスケープが達成されるかを示した。その結果によれば、A型インフルエンザ、HIV-1およびSARS-CoV-2の蛋白質についてそれぞれ作成された言語モデルにより、エスケープを可能にする原因変異が正確に予測され、高いエスケープ能をもたらす構造領域が明らかにされた。これらのモデルは、事前のトレーニングなしに、また生の配列データのみを用いて上記のような結果を達成した。著者らは、SARS-CoV-2の場合、スパイク蛋白質(これによりウイルスは細胞に感染する)におけるエスケープ能が、2つのドメインにおいて非常に高くなっており、別のドメインでは枯渇していることを明らかにした。

###


Disclaimer: AAAS and EurekAlert! are not responsible for the accuracy of news releases posted to EurekAlert! by contributing institutions or for the use of any information through the EurekAlert system.