(un)Weighted UniFrac 分析
UniFrac分析利用各樣品序列間的進(jìn)化信息來(lái)比較環(huán)境樣品在特定的進(jìn)化譜系中是否有顯著的微生物群落差異。 UniFrac 可用于beta 多樣性的評(píng)估分析,即對(duì)樣品兩兩之間進(jìn)行比較分析,得到樣品間的unifrac距離矩陣。其計(jì)算方法為:首先利用來(lái)自不同環(huán)境樣品的OTU 代表序列構(gòu)建一個(gè)進(jìn)化樹,Unifrac 度量標(biāo)準(zhǔn)根據(jù)構(gòu)建的進(jìn)化樹枝的長(zhǎng)度計(jì)量?jī)蓚€(gè)不同環(huán)境樣品之間的差異,差異通過(guò)0-1 距離值表示,進(jìn)化樹上最早分化的樹枝之間的距離為1,即差異最大,來(lái)自相同環(huán)境的樣品在進(jìn)化樹中會(huì)較大幾率集中在相同的節(jié)點(diǎn)下,即它們之間的樹枝長(zhǎng)度較短,相似性高。若兩個(gè)群落完全相同,那么它們沒有各自獨(dú)立的進(jìn)化過(guò)程,UniFrac值為0;若兩個(gè)群落在進(jìn)化樹中完全分開,即它們是完全獨(dú)立的兩個(gè)進(jìn)化過(guò)程,那么UniFrac值為1。
從UniFrac的定義中,可以看出它只考慮序列是否在群落中出現(xiàn),而不考慮序列的豐度。若兩個(gè)群落包含的物種完全相同,那么不管每個(gè)物種的豐度是否有差別或者差別的大小,UniFrac值為0。weighted unifrac方法,就是在UniFrac的基礎(chǔ)上,將序列的豐度納入考慮,它能夠區(qū)分物種豐度的差別。在計(jì)算中, weighted unifrac按照每條枝指向的葉節(jié)點(diǎn)中來(lái)自兩個(gè)群落的比例,給每條枝加權(quán)重。因此unweighted unifrac 可以檢測(cè)樣品間變化的存在,而weighted unifrac 可以更進(jìn)一步定量的檢測(cè)樣品間不同譜系上發(fā)生的變異。
軟件及算法:使用FastTree(version 2.1.3 http://www.microbesonline.org/fasttree/)根據(jù)最大似然法( approximately-maximum-likelihood phylogenetic trees ) 構(gòu)建進(jìn)化樹,然后利用Fastunifrac[2] (http://unifrac.colorado.edu/)分析得到樣品間距離矩陣。
Table(un)weighted unifrac distance matrix
注:第一行和第一列均為樣品。
參考文獻(xiàn):
[1] Tanya Yatsunenko, Federico, et al. Human gut microbiome viewed across age and geography. Nature486, 222–227 (14 June 2012) doi:10.1038.nature11053.
[2] Micah Hamady, Catherine Lozupone and Rob Knight. Fast UniFrac:facilitatinghigh-throughput phylogenetic analyses of microbial communities including analysis of pyrosequencing and PhyloChip data.The ISME Journal (2010) 4, 17–27; doi:10.1038/ismej.2009.97
基于UniFrac 的Pcoa 分析
Unifrac 分析得到的距離矩陣可用于多種分析方法,可通過(guò)多變量統(tǒng)計(jì)學(xué)方法PCoA 分析,直觀顯示不同環(huán)境樣品中微生物進(jìn)化上的相似性及差異性。 PCoA(principal co-ordinates analysis)是一種研究數(shù)據(jù)相似性或差異性的可視化方法,通過(guò)一系列的特征值和特征向量進(jìn)行排序后,選擇主要排在前幾位的特征值,PCoA 可以找到距離矩陣中最主要的坐標(biāo),結(jié)果是數(shù)據(jù)矩陣的一個(gè)旋轉(zhuǎn),它沒有改變樣品點(diǎn)之間的相互位置關(guān)系,只是改變了坐標(biāo)系統(tǒng)。通過(guò)PCoA 可以觀察個(gè)體或群體間的差異。
分析軟件:R 語(yǔ)言PCoA 分析和作PCoA 圖。
unifrac.pcoa.tiff :樣品PCoA 分析圖
Fig (un)weighted unifrac PCoA analysis
參考文獻(xiàn):
Xiao-Tao Jiang ,Xin Peng, et al.Illumina Sequencing of 16S rRNA Tag Revealed Spatial Variations of Bacterial Communities in a Mangrove Wetland. Microb Ecol (2013) 66:96–104.DOI10.1007/s00248-013-0238-8.
注:PC1 和PC2 是兩個(gè)主坐標(biāo)成分,PC1 表示盡可能最大解釋數(shù)據(jù)變化的主坐標(biāo)成分,PC2 為解釋余下的變化度中占比例最大的主坐標(biāo)成分,PC3 等依次類推。
基于UniFrac 的多樣品相似度樹分析
Unifrac 分析得到的距離矩陣可用于多種分析方法,通過(guò)層次聚類(Hierarchical cluatering)[1]中的非加權(quán)組平均法UPGMA 構(gòu)建進(jìn)化樹等圖形可視化處理,可以直觀顯示不同環(huán)境樣品中微生物進(jìn)化上的相似性及差異性。
UPGMA(Unweighted pair group method with arithmetic mean)假設(shè)在進(jìn)化過(guò)程中所有核苷酸/氨基酸都有相同的變異率,即存在著一個(gè)分子鐘。通過(guò)樹枝的距離和聚類的遠(yuǎn)近可以觀察樣品間的進(jìn)化距離。
分析軟件: R 語(yǔ)言vegan 包UPGMA 分析和作進(jìn)化樹。

(un) weighted unifrac tree analysis
注:樹枝顏色為預(yù)先定義的不同分組標(biāo)注。
參考文獻(xiàn):
[1] Magali Noval Rivas, PhD, Oliver T. Burton, et al. A microbita signature associated with experimental food allergy promotes allergic senitization and anaphylaxis. The Journal of Allergy and Clinical Immunology.Volume 131, Issue 1 , Pages 201-212, January 2013.

微基生物 您自己的微生態(tài)研究團(tuán)隊(duì)|專注微生態(tài)研究與應(yīng)用

