上期我們介紹了稀釋性曲線和Rank Abundance曲線的意義,這期主要介紹物種豐度統(tǒng)計(jì)和系統(tǒng)發(fā)育樹(shù)的構(gòu)建。 1. 物種豐度統(tǒng)計(jì) 16S的數(shù)據(jù)分析,原理是將相似度較高(一般97%以上)的序列進(jìn)行歸類,并稱之為一個(gè)OTU,每一個(gè)OTU可以認(rèn)為是一個(gè)菌屬(16S很難精確到種水平)。對(duì)每個(gè)OTU進(jìn)行注釋即可知道對(duì)應(yīng)的菌屬名稱,注釋的方法是將OTU的代表序列與數(shù)據(jù)庫(kù)進(jìn)行比對(duì),找出其最相近且可信度達(dá)80%以上的種屬信息。最后統(tǒng)計(jì)每個(gè)OTU對(duì)應(yīng)的所有序列數(shù)目,將得到的結(jié)果記錄在表格文件中,即可得到每個(gè)屬及其對(duì)應(yīng)的序列數(shù)目。如下圖,第一二列為物種分類信息,后面1-9每一列是一個(gè)樣本。 ![]() 通常我們會(huì)將序列數(shù)除以總序列數(shù)得到每個(gè)菌的相對(duì)豐度,并且繪制累積柱狀圖(如下圖)。圖中NA1-NA7代表7個(gè)不同的樣本,每一種顏色代表一種菌,某種顏色占總柱子的百分比顯示了該菌在總菌中所占的百分比,這種柱狀圖可以直觀的比較不同樣本的物種組成。 此外,柱狀圖左側(cè)是樣本的聚類分析結(jié)果,基于樣本的群落組成情況進(jìn)行聚類(bray-curtis 算法),主要展示樣本的物種組成相似情況。處于同一個(gè)分支下的樣本,物種組成相似度較高,距離越遠(yuǎn)的樣本物種組成差異越大。 ![]() 2. 系統(tǒng)發(fā)育樹(shù) 前面,我們已經(jīng)得到了物種(OTU)注釋信息以及它的豐度,這一步要做的是將物種信息回歸至數(shù)據(jù)庫(kù)的分類學(xué)系統(tǒng)關(guān)系樹(shù)中,從整個(gè)分類系統(tǒng)上全面了解測(cè)序的環(huán)境樣品中所有微生物的進(jìn)化關(guān)系。NCBI數(shù)據(jù)庫(kù)提供了已有微生物物種的分類學(xué)信息數(shù)據(jù)庫(kù)(ftp://ftp.ncbi.nih.gov/pub/taxonomy/),該數(shù)據(jù)庫(kù)還包含了微生物的分類學(xué)系統(tǒng)關(guān)系樹(shù)的信息。另外,還可以加上每個(gè)物種豐度情況,全面展示物種進(jìn)化關(guān)系和在不同樣本中的豐度差異。 如下圖所示,圖中的支點(diǎn)表示該處在NCBI 數(shù)據(jù)庫(kù)中有相應(yīng)的Taxonomy 記錄,支點(diǎn)出有英文名標(biāo)記物種分類信息,距離越近的菌表示進(jìn)化關(guān)系越近。此外,每個(gè)支點(diǎn)處都有一個(gè)餅狀圖,標(biāo)示不同樣品的相對(duì)豐度差異。圖中四種顏色代表了4個(gè)不同的樣本,在最上面一支中,橙色樣本(sample3)的豐度高于其他樣本。 ![]() |
|