在一项涉及全基因组数据的新研究中,研究人员推出了“CASTER”,这是一种用 DNA 序列排列(名为位点模式)来推断“物种树”的工具,这些“物种树”描述了物种间的演化关系图。该工具具有出色的准确性和可扩展性,克服了传统系统发生学方法的局限性,为演化研究提供了转变潜力。基因组数据的日益普及重新激发了人们对构建精确物种树和模拟基因树变异的努力。然而,利用全基因组数据的方法却滞后于可用的数据。虽然传统方法难以进行不完全谱系分选 (ILS),而两步法又面临计算障碍,但新兴的基于位点的方法则可解决 ILS 的问题,可是它会受到可扩展性和欠缺准确性的阻碍。为此,Chao Zhang 和同事开发了 CASTER(基于合并感知的比对物种树估计器),这是一种直接用全基因组比对推断物种树的新方法。通过对先前研究过的基因组数据集(包括鸟类和哺乳动物)进行广泛的模拟和分析,Zhang 等人证明,在分析数百个重组基因组并进行精确系统发生推断时,CASTER 通常比其他最先进的方法要更快且更为准确。然而,尽管 CASTER 前景光明,但作者仍指出了它的局限性,其中包括它没有分支长度及对特定演化模型假设的依赖。未来的发展目标是解决这些理论和实践上的挑战,将该工具的适用性扩展到更广泛的数据类型和更复杂的生物学场景。
关注研究诚信问题的记者请注意,作者 Siavash Mir Arabbaygi 指出:“我们的领域在确保(几乎)所有实践中使用的工具皆为开源方面取得了长足进步(包括在本文中介绍的方法和由我们实验室介绍的所有其他方法)。该领域的顶级期刊也在鼓励作者为公共存储库(如 Dryad、Zenodo 和 FigShare)提供数据方面成绩亮眼。作者提供的数据细节程度各不相同,其部分原因是因为导出大型数据集需付出努力,部分原因是公共存储库对所供数据的规模存在一些限制。与其他一些领域不同,系统发生学研究在数据共享方面一直非常开放和慷慨。”
Journal
Science
Article Title
CASTER: Direct species tree inference from whole-genome alignments
Article Publication Date
23-Jan-2025