heatmap(熱圖),首發(fā)于微基生物。
]]>例圖:


注釋:
樣品間聚類關(guān)系樹: 進(jìn)化樹表示在選用成圖數(shù)據(jù)中,樣本與樣本間序列的進(jìn)化關(guān)系(差異關(guān)系)。處于同一分支內(nèi)的樣品序列進(jìn)化關(guān)系相近。
物種/OTU?豐度相似性樹: 豐度相似性樹表示選用成圖的數(shù)據(jù)中樣品與樣品中的OTU?或序列在豐度上的相似程度。豐度最相近的會分配到同一分支上
heatmap(熱圖),首發(fā)于微基生物。
]]>

PCoA 主坐標(biāo)分析,首發(fā)于微基生物。
]]>PCoA(principal co-ordinates analysis)是一種研究數(shù)據(jù)相似性或差異性的可視化方法,通過一系列的特征值和特征向量進(jìn)行排序后,選擇主要排在前幾位的特征值,PCoA 可以找到距離矩陣中最主要的坐標(biāo),結(jié)果是數(shù)據(jù)矩陣的一個旋轉(zhuǎn),它沒有改變樣品點(diǎn)之間的相互位置關(guān)系,只是改變了坐標(biāo)系統(tǒng)。通過PCoA 可以觀察個體或群體間的差異。
分析軟件:R 語言PCoA 分析和作PCoA 圖。
unifrac.pcoa.tiff :樣品PCoA 分析圖
參考文獻(xiàn):
Xiao-Tao Jiang ,Xin Peng, et al.Illumina Sequencing of 16S rRNA Tag Revealed Spatial Variations of Bacterial Communities in a Mangrove Wetland. Microb Ecol (2013) 66:96–104.DOI10.1007/s00248-013-0238-8.

注:PC1 和PC2 是兩個主坐標(biāo)成分,PC1 表示盡可能最大解釋數(shù)據(jù)變化的主坐標(biāo)成分,PC2 為解釋余下的變化度中占比例最大的主坐標(biāo)成分,PC3 等依次類推。
PCoA 主坐標(biāo)分析,首發(fā)于微基生物。
]]>(un)Weighted UniFrac 分析,首發(fā)于微基生物。
]]>UniFrac分析利用各樣品序列間的進(jìn)化信息來比較環(huán)境樣品在特定的進(jìn)化譜系中是否有顯著的微生物群落差異。 UniFrac 可用于beta 多樣性的評估分析,即對樣品兩兩之間進(jìn)行比較分析,得到樣品間的unifrac距離矩陣。其計算方法為:首先利用來自不同環(huán)境樣品的OTU 代表序列構(gòu)建一個進(jìn)化樹,Unifrac 度量標(biāo)準(zhǔn)根據(jù)構(gòu)建的進(jìn)化樹枝的長度計量兩個不同環(huán)境樣品之間的差異,差異通過0-1 距離值表示,進(jìn)化樹上最早分化的樹枝之間的距離為1,即差異最大,來自相同環(huán)境的樣品在進(jìn)化樹中會較大幾率集中在相同的節(jié)點(diǎn)下,即它們之間的樹枝長度較短,相似性高。若兩個群落完全相同,那么它們沒有各自獨(dú)立的進(jìn)化過程,UniFrac值為0;若兩個群落在進(jìn)化樹中完全分開,即它們是完全獨(dú)立的兩個進(jìn)化過程,那么UniFrac值為1。
從UniFrac的定義中,可以看出它只考慮序列是否在群落中出現(xiàn),而不考慮序列的豐度。若兩個群落包含的物種完全相同,那么不管每個物種的豐度是否有差別或者差別的大小,UniFrac值為0。weighted unifrac方法,就是在UniFrac的基礎(chǔ)上,將序列的豐度納入考慮,它能夠區(qū)分物種豐度的差別。在計算中, weighted unifrac按照每條枝指向的葉節(jié)點(diǎn)中來自兩個群落的比例,給每條枝加權(quán)重。因此unweighted unifrac 可以檢測樣品間變化的存在,而weighted unifrac 可以更進(jìn)一步定量的檢測樣品間不同譜系上發(fā)生的變異。
軟件及算法:使用FastTree(version 2.1.3 http://www.microbesonline.org/fasttree/)根據(jù)最大似然法( approximately-maximum-likelihood phylogenetic trees ) 構(gòu)建進(jìn)化樹,然后利用Fastunifrac[2] (http://unifrac.colorado.edu/)分析得到樣品間距離矩陣。
Table(un)weighted unifrac distance matrix
注:第一行和第一列均為樣品。
參考文獻(xiàn):
[1] Tanya Yatsunenko, Federico, et al. Human gut microbiome viewed across age and geography. Nature486, 222–227 (14 June 2012) doi:10.1038.nature11053.
[2] Micah Hamady, Catherine Lozupone and Rob Knight. Fast UniFrac:facilitatinghigh-throughput phylogenetic analyses of microbial communities including analysis of pyrosequencing and PhyloChip data.The ISME Journal (2010) 4, 17–27; doi:10.1038/ismej.2009.97
Unifrac 分析得到的距離矩陣可用于多種分析方法,可通過多變量統(tǒng)計學(xué)方法PCoA 分析,直觀顯示不同環(huán)境樣品中微生物進(jìn)化上的相似性及差異性。 PCoA(principal co-ordinates analysis)是一種研究數(shù)據(jù)相似性或差異性的可視化方法,通過一系列的特征值和特征向量進(jìn)行排序后,選擇主要排在前幾位的特征值,PCoA 可以找到距離矩陣中最主要的坐標(biāo),結(jié)果是數(shù)據(jù)矩陣的一個旋轉(zhuǎn),它沒有改變樣品點(diǎn)之間的相互位置關(guān)系,只是改變了坐標(biāo)系統(tǒng)。通過PCoA 可以觀察個體或群體間的差異。
分析軟件:R 語言PCoA 分析和作PCoA 圖。
unifrac.pcoa.tiff :樣品PCoA 分析圖
Fig (un)weighted unifrac PCoA analysis
參考文獻(xiàn):
Xiao-Tao Jiang ,Xin Peng, et al.Illumina Sequencing of 16S rRNA Tag Revealed Spatial Variations of Bacterial Communities in a Mangrove Wetland. Microb Ecol (2013) 66:96–104.DOI10.1007/s00248-013-0238-8.
注:PC1 和PC2 是兩個主坐標(biāo)成分,PC1 表示盡可能最大解釋數(shù)據(jù)變化的主坐標(biāo)成分,PC2 為解釋余下的變化度中占比例最大的主坐標(biāo)成分,PC3 等依次類推。
Unifrac 分析得到的距離矩陣可用于多種分析方法,通過層次聚類(Hierarchical cluatering)[1]中的非加權(quán)組平均法UPGMA 構(gòu)建進(jìn)化樹等圖形可視化處理,可以直觀顯示不同環(huán)境樣品中微生物進(jìn)化上的相似性及差異性。
UPGMA(Unweighted pair group method with arithmetic mean)假設(shè)在進(jìn)化過程中所有核苷酸/氨基酸都有相同的變異率,即存在著一個分子鐘。通過樹枝的距離和聚類的遠(yuǎn)近可以觀察樣品間的進(jìn)化距離。
分析軟件: R 語言vegan 包UPGMA 分析和作進(jìn)化樹。

(un) weighted unifrac tree analysis
注:樹枝顏色為預(yù)先定義的不同分組標(biāo)注。
參考文獻(xiàn):
[1] Magali Noval Rivas, PhD, Oliver T. Burton, et al. A microbita signature associated with experimental food allergy promotes allergic senitization and anaphylaxis. The Journal of Allergy and Clinical Immunology.Volume 131, Issue 1 , Pages 201-212, January 2013.
(un)Weighted UniFrac 分析,首發(fā)于微基生物。
]]>metastats組間群落顯著性差異分析,首發(fā)于微基生物。
]]>使用軟件:利用matastats [2](http://metastats.cbcb.umd.edu/)對不同分類學(xué)水平進(jìn)行的兩組樣本進(jìn)行顯著性差異分析,同時整理了高分類學(xué)水平中包含的低分類學(xué)水平的物種的顯著性差異情況。
參考文獻(xiàn):
[1] Tingting Wang, Guoxiang Cai, et al. Structural segregation of gut microbiota between colorectal cancer patients and healthy volunteers. The ISME Journal advance online publication, 18 August 2011;doi:10.1038/ismej.2011.109.
[2] White, J.R., Nagarajan, N. & Pop, M. Statistical methods for detecting differentially abundant features in clinical metagenomic samples. PLoS Comput Biol 5, e1000352 (2009).
注:mean:均值; variance:方差; standard:標(biāo)準(zhǔn)差;
p value (an individual measure of the false positive rate) 假陽性概率值,是統(tǒng)計學(xué)中常用的判定值,一般來說P value<0.05 時差異顯著;
q value (an individual measurement of the false discovery rate) 假發(fā)現(xiàn)率評估值,指本次計算可信度。
多水平整理表如下所示:
注:表中同時計算了門水平及其包含的屬水平在兩組樣本中的顯著性差異情況。
metastats組間群落顯著性差異分析,首發(fā)于微基生物。
]]>