近日在线发表于《科学》的一项新研究显示,从世界各地收集的海水样本为人们提供了一个关于RNA病毒的新数据宝库,增加了生态学研究的可能性,重塑了人们对这些微小但重要的亚微观颗粒如何进化的理解。
将机器学习分析与传统发育树相结合,一个国际研究团队确定了5500个RNA病毒新物种,它们代表了所有已知的5个RNA病毒门,且至少需要5个新的RNA病毒门囊括它们。其中,最丰富的新发现物种属于研究人员拟命名的Taraviricota门。
论文主要作者、美国俄亥俄州立大学微生物学教授Matthew Sullivan表示:“对我们的世界而言,RNA病毒显然很重要,但我们通常只研究其中一小部分——几百种危害人类、植物和动物的病毒。我们想在非常大的范围内系统地研究它们,探索一个尚未被深入研究过的环境。我们很幸运,因为几乎每个物种都是新的。”
“整个海洋中都发现了Taraviricota门,表明它们在生态上很重要。”Sullivan举例说。
微生物是地球上所有生命的重要组成部分,感染它们或与其相互作用的病毒对微生物功能有多种影响。这些病毒被认为有3个主要功能:杀死细胞,改变被感染细胞管理能量的方式,以及将基因从一个宿主转移到另一个宿主。
研究人员称,更多地了解海洋中病毒的多样性和丰度,将有助于解释海洋微生物在海洋适应气候变化中的作用。他们此前的研究表明,海洋病毒是生物泵的“旋钮”,影响着海洋中的碳储存方式。
长期以来,Sullivan团队一直对海洋中的DNA病毒物种进行分类,使其数量从2015年至2016年的几千种增加到2019年的20万种。该团队现在的工作主要集中在RNA病毒病原体分类上。
尽管研究团队发现了属于现有分类的数百种RNA病毒新物种,但他们的分析更发现了数千种以上的病毒“无门无派”,于是将它们归入5个新提出的门:Taraviricota、Pomiviricota、Paraxenoviricota、Wamoviricota和Arctiviricota。国际病毒分类委员会最近确认了5个门。
在此前的DNA病毒研究中,科学家使用病毒颗粒完成分析。而在目前检测RNA病毒的过程中,没有需要研究的病毒颗粒。相反,他们从漂浮在海上的生物体所表达的基因中提取序列,并将分析范围缩小到包含一种被称为RdRp的特征基因的RNA序列。该基因在RNA病毒中进化了数十亿年,而在其他病毒或细胞中不存在。
由于RdRp可以追溯到地球上首次发现生命之时,其序列位置已经多次偏离,这意味着传统的系统发育树不可能仅用序列描述。取而代之的是,该团队使用机器学习处理4.4万个新序列,并通过对已经识别的RNA病毒序列进行分类,准确验证了该方法。
“我们必须以已知为基准研究未知。”Sullivan表示,“我们创造了一种可重复计算的方法,将这些序列对齐到我们更有把握的位置,从而准确地反映了进化。”
利用三维序列结构和比对的进一步分析显示,5500个新物种不符合现有的5个RNA病毒门。论文第一作者之一、俄亥俄州立大学微生物学家Ahmed Zayed说:“我们根据已知公认的基于系统发育的分类群对它们进行基准测试,发现我们的分类更丰富。”
这些发现使研究人员不仅提出了5个新的RNA病毒门,而且提出了至少11个新的RNA病毒分类。
“RdRp基因随时间分化的新数据,使我们更好地了解地球上的早期生命可能是如何进化的。所以我们不仅在追踪病毒的起源,也在追踪生命的起源。”Zayed表示。(作者:王方)