全ゲノムデータを用いた新しい研究において、「CASTER」が提案された。CASTERとは、部位パターンと呼ばれるDNA配列の並びを利用して、種間の進化的関係を示す図「種系統樹」を推定するツールである。卓越した精度と拡張性を備え、従来の系統学的手法の限界を克服したこのツールは、進化研究を変革する可能性を秘めている。ゲノムデータの利用可能性が高まっていることから、正確な種系統樹を描き、遺伝子系統樹の変化をモデル化する取り組みが再び活発になっている。しかし、ゲノム規模のデータを利用する手法は、データの利用可能性に後れを取っている。従来の手法は不完全遺伝子系統仕分け(ILS)に苦戦しており、2段階アプローチは計算上の課題に直面している一方で、部位に基づく新たな手法はILSに対処できるものの、拡張性と精度の問題がネックになっている。これを受けてChao Zhangらは、全ゲノムアラインメントから種系統樹を直接推定する新しい手法、CASTER(Coalescence-aware Alignment-based Species Tree Estimator)を開発した。Zhangらは、これまでに研究されたゲノムデータセット(鳥類と哺乳類を含む)に対して広範なシミュレーションおよび分析を行うことにより、組み換えが起こった何百ものゲノムを正確な系統学的推定に基づいて解析する際に、CASTERは概して他の最先端の手法よりも迅速かつ正確であることを実証した。しかし著者らは、CASTERは有望ではあるが、枝長がないことや特定の進化モデルの仮定に依存していることなど、限界があると述べている。今後の開発では、こうした理論的および現実的な課題に対処し、このツールの適用範囲をより広範なデータ型やより複雑な生物学的シナリオに拡大することを目指すという。
研究公正の問題に関心がある記者に向けて、著者のSiavash Mir Arabbaygiは次のように述べている。「我々の研究分野は、実際に使用される(ほぼ)すべてのツール(本論文で紹介する手法と、我々の研究室で導入したその他のすべての手法を含む)をオープンソースにすることで、大きな進歩を遂げてきた。しかも、この分野の一流学術誌は、Dryad、Zenodo、FigShareなどのリポジトリでデータを公開するよう著者に促すという、立派な取り組みをしている。著者らがさまざまな詳細度でデータを提供しているのは、一つには大規模なデータセットをエクスポートするのにこうした工夫が必要なためであり、また一つには公開リポジトリには提供データのサイズに関していくつかの制限があるためである。他の分野とは異なり、系統学研究はデータ共有に関して非常にオープンで寛大である。」
Journal
Science
Article Title
CASTER: Direct species tree inference from whole-genome alignments
Article Publication Date
23-Jan-2025