微生物进化树构建方法


打开文本图片集

摘要    进化树的构建是当代生命科学技术中最为重要的技术之一,可以分析未知微生物和已知微生物的亲疏关系,从而进一步获取微生物进化关系的重要证据。本文对微生物进化树的构建进行了研究,阐述了进化树的原理,梳理了相关的理论,同时全面地介绍了最常用的构建进化树的软件及其功能,详细地介绍了微生物进化树的构建方法,以期为更便捷地开展后续研究提供参考。

关键词    微生物;进化树;构建

中图分类号    Q393         文献标识码    A

文章编号   1007-5739(2019)19-0249-02                                                                                     开放科学(资源服务)标识码(OSID)

Construction  of  Microbial  Evolutionary  Trees

LI Si-yu    Liu Xue    WANG Wen-jing    LU Song-lin    HAO Xue-meng    ZHANG Jie *

(The College of Life Science,Northeast Forestry University,Haerbin Heilongjiang 150040)

Abstract    The construction of evolutionary tree is one of the most important technologies in modern life science and technology,which can analyze the affinity between unknown microorganisms and known microorganisms,so as to further obtain important evidence of microbial evolutionary relationship. In this paper,the construction of the microbial evolutionary tree was studied,the principle of the evolutionary tree was expounded,the rel-evant theories were sorted out,the most commonly used software and functions of the construction of the evolutionary tree were introduced,and the construction method of the microbial evolutionary tree was introduced in detail,so as to provide references for the convenient follow-up research.

Key words    microorganism;evolutionary tree;construction

在人類的生产和生活中,微生物必不可少,其影响着人类生活的方方面面。微生物在人类的健康和疾病中都发挥了重要作用,因而科学家们和研究者对微生物的研究和探索日益增多[1]。微生物和地球上其他生物都像树一样的分化生长[2],而微生物的分布通常以物种的成分或者相对丰度进行衡量。刘娜[3]认为在进化树的框架中,分支越近,物种的进化关系越近。将微生物进化树的信息进行整合,可以高效地分析微生物组的数据信息,从而确定微生物的进化方向[4]。

1    进化树的概述

微生物的多样性通常用进化树来表现。进化树从本质上讲是对某一物种的发育进行分析,根据相同物种的不同性状来分析二者之间的进化关系。构建进化树需多个学科融合,不仅包括分子生物学、遗传学、生态学等生命科学学科,还包括统计学、计算机科学等数学学科,是一门交叉学科[5]。微生物进化树的构建过程主要有获取序列数据、进化距离模型的确定、多个序列的对比、再提取对比后的结果、算法和参数的选择[6]。目前,进化树的信息构建包括了数据库的建立、进化树构建方法、进化树信息数据挖掘等。进化树数据库的建立实际是2级数据库的构建,即初级数据库和次级数据库。构建进化树方法有最小进化法、邻接法、最大简约法、最大似然法等[7]。

1.1    进化树形式

进化树有2种形式,无根树和有根树。其中,有根树可以表现进化的顺序;无根树功能单一,只能表示微生物之间的发育关系,无法说明进化的途径。简单来说,就是甲、乙、丙、丁4种生物,从无根树中可以看出甲与乙较甲与丙、丁具有更近的亲缘关系;而从有根树中不仅能够表示出甲、乙、丙、丁的亲疏关系,更能看出4种生物的起源和进化的方向[8]。在解决现实的进化树的问题中,常因为无法获取足够的信息来确定进行方向,没有足够的证据来证明进化树的节点,所以一般获得的进化树都是无根的。李建伏[6]在研究中认为,在分析进化树时有2个重量级的参考量即拓扑结构和根支长度。其中,拓扑结构更为重要,更加受到科学家的关注。在进化树研究的初期,可以通过微生物的表观特征进行进化分析,但是该方法具有缺陷、可信度较低。刘娜[3]曾经在研究中表明,现今对于进化分析方法的研究已经达到了分子水平,即从蛋白质序列出发,通过进化分析的方法,研究分析进化的关系,得到进化树。这种方法从生命遗传的角度出发,使得研究结果更为可信[7]。郝柏林[9]构建了一种新的方法,即对物种进行矢量刻画,无需序列对比构建进化树[10]。

1.2    進化树分析

一般采用以下几个步骤分析进化树:首先,对分析的进化树的序列目标进行排列,常用的排序对比工具为CLUSTALX[11]。其次,构建完整的进化树。通常来说,构建进化树常用的算法为独立元素法和距离依靠法。独立元素算法是指排列好的序列上每个碱基或者氨基酸的性状决定了进化树的拓扑形状[12]。例如,序列上的碱基状态决定了序列上的酶切位点的存在和个数,换言之,当对进化树进行序列分析时,进化树的拓扑形状也由碱基的状态来决定。距离依靠法相对于独立元素算法来说较为宏观,序列间距离决定进化树的拓扑形状。最后,评估进化树的可信度,惯用方法为自举法,经过反复多次的采集数据,再进行进化树的构建,检验结果是否稳定。故而,自举法通常用来检验一个完整进化树的树枝出现频率的稳定性以及检验其可信程度。

2    构建常用软件

微生物进化树构建采用的软件都已成熟,例如PHYLIP、MEGA、ARB、PAML等。本文列出了常用的进化树构建软件、算法及特点,见表1。

2.1    PHYLIP软件介绍

PHYLIP是微生物进化树构建最为常用的软件,是一种多平台的操作系统,由Joseph Felsenstein开发研究。它的功能极为强大,它可以分析蛋白质和基因的序列,可以对酶切位点进行分析,同时可以分析进化树的距离矩阵以及基因频率。其具备进化树绘制功能,可以精准的分析控制过程。PHYLIP在官网下载,解压后可以看到多个软件的压缩包,下载后可以实现双击后自动解压,具有完整的进化树的构建功能,主要的程序功能:①蛋白质序列数据和DNA基因序列的分析功能,有4个不同的程序,分别为DNADIST、DNAPARS、DNAML和DNAMLK程序,共同完成进化树的构建;②将序列数据进行转换,转换为距离数据,再分析距离数据;③可以分析基因频率,同时进行连续元素的分析;④可以绘制、分析和修改进化树的图。

2.2    MEGA软件介绍

MEGA软件可以对序列进行对比分析,同时进行统计分析。在这个软件中,进行对比分析的方法是距离建树法和MP建树法,可以对序列进行自动或者手动的对比。绘制进化树时对进化率进行估算,同时对结果进行验证,另外其还可以连接网络,进行数据库检索。MEGA软件中包含的功能模块主要有几个功能:①对蛋白质序列和DNA序列数据进行分析的功能模块;②将序列数据进行转换,转换为距离数据,再分析距离数据的功能模块;③可以分析基因频率,同时进行连续元素的分析的功能模块;④将每个碱基或者氨基酸进行独立对待,进行序列分析的功能模块;⑤可以绘制、分析和修改进化树的图,进行网上blast搜索。

3    构建

对一个完整的进化树进行分析,主要进行以下步骤分析。首先,锁定目标序列,并排列多序列目标;其次,构建完整的进化树雏形;最后,评估所得到的进化树的可信程度。

在微生物进化树的构建中最常用的软件就是PHYLIP和MEGA 2种软件。对这2种软件构建的进化树进行对比和分析,可以非常清楚地了解微生物的进化关系。

3.1    通过PHYLIP软件进行进化树的构建

通过PHYLIP软件构建进化树的具体过程见图1。

3.2    利用MEGA3.1软件构建菌株的系统发育树

利用MEGA3.1软件构建进化树的具体过程见图2。由此可知,构建进化树的时间和序列的数量正相关,树枝上的数字所表示的是进化树可信度的比例。

4    结语

随着工业化的发展、科技发展的进步,人们越来越关注对微生物资源的利用,如微生物对重金属离子污染的治理、微生物制药等。对微生物进化树的原理进行解释、对进化树的构建软件工具进行介绍、对进化树的构建方法进行详细的描述等具有重要意义。以理论和实践相结合的方式对进化树的构建进行研究,有利于人们对微生物的进化关系有更深刻的理解,从而更好地进行研究。

5    参考文献

[1] 张璇.利用共生微生物研究河豚毒素的生物合成途径[D].青岛:国家海洋局第一海洋研究所,2013.

[2] 李宗玮.基于高通量测序的微生物辨识、进化与耐药性生物信息学分析[D].北京:中国人民解放军军事医学科学院,2016.

[3] 刘娜.生物序列/结构的比较及进化树的构建[D].大连:大连理工大学,2007.

[4] 邓元慧,王国强.人类对微生物的发现与探索之路[J].张江科技评论,2019(2):72-77.

[5] 张晨曦.分子生物学方法在微生物多样性研究中的应用[J].化工管理,2017(11):124-125.

[6] 李建伏.基于DNA序列的进化树构建算法的研究[D].哈尔滨:哈尔滨工业大学,2008.

[7] 郭园,赵仲麟.微生物系统定向进化与合成生物学应用研究进展[J].生物技术通报,2017,33(1):76-82.

[8] 肖勇,肖长烨.微生物在不同环境下的进化机制研究进展[J].华侨大学学报(自然科学版),2019,40(1):1-8.

[9] 郝柏林.生物信息学[J].中国科学院院刊,2000(4):260-264.

[10]龙瑞军,赵方庆,施鹏.高原哺乳动物瘤胃微生物组的趋同进化[J].科学新闻,2017(4):120.

[11] 张原野.整合进化树信息的微生物组数据分析方法研究[D].武汉:华中师范大学,2018.

[12] 朱晁谊,朱牧孜,李爽.微生物实验室进化的研究进展[J].生物加工过程,2019,17(1):8-14.