16S測(cè)序結(jié)果解讀2—物種豐度統(tǒng)計(jì)和系統(tǒng)發(fā)育樹(shù)

高六博 2018-06-26

展開(kāi)全文

上期我們介紹了稀釋性曲線和Rank Abundance曲線的意義，這期主要介紹物種豐度統(tǒng)計(jì)和系統(tǒng)發(fā)育樹(shù)的構(gòu)建。

1. 物種豐度統(tǒng)計(jì)

16S的數(shù)據(jù)分析，原理是將相似度較高（一般97%以上）的序列進(jìn)行歸類，并稱之為一個(gè)OTU，每一個(gè)OTU可以認(rèn)為是一個(gè)菌屬（16S很難精確到種水平）。對(duì)每個(gè)OTU進(jìn)行注釋即可知道對(duì)應(yīng)的菌屬名稱，注釋的方法是將OTU的代表序列與數(shù)據(jù)庫(kù)進(jìn)行比對(duì)，找出其最相近且可信度達(dá)80%以上的種屬信息。最后統(tǒng)計(jì)每個(gè)OTU對(duì)應(yīng)的所有序列數(shù)目，將得到的結(jié)果記錄在表格文件中，即可得到每個(gè)屬及其對(duì)應(yīng)的序列數(shù)目。如下圖，第一二列為物種分類信息，后面1-9每一列是一個(gè)樣本。

通常我們會(huì)將序列數(shù)除以總序列數(shù)得到每個(gè)菌的相對(duì)豐度，并且繪制累積柱狀圖（如下圖）。圖中NA1-NA7代表7個(gè)不同的樣本，每一種顏色代表一種菌，某種顏色占總柱子的百分比顯示了該菌在總菌中所占的百分比，這種柱狀圖可以直觀的比較不同樣本的物種組成。

此外，柱狀圖左側(cè)是樣本的聚類分析結(jié)果，基于樣本的群落組成情況進(jìn)行聚類（bray-curtis 算法），主要展示樣本的物種組成相似情況。處于同一個(gè)分支下的樣本，物種組成相似度較高，距離越遠(yuǎn)的樣本物種組成差異越大。

2. 系統(tǒng)發(fā)育樹(shù)

前面，我們已經(jīng)得到了物種（OTU）注釋信息以及它的豐度，這一步要做的是將物種信息回歸至數(shù)據(jù)庫(kù)的分類學(xué)系統(tǒng)關(guān)系樹(shù)中，從整個(gè)分類系統(tǒng)上全面了解測(cè)序的環(huán)境樣品中所有微生物的進(jìn)化關(guān)系。NCBI數(shù)據(jù)庫(kù)提供了已有微生物物種的分類學(xué)信息數(shù)據(jù)庫(kù)（ftp://ftp.ncbi.nih.gov/pub/taxonomy/），該數(shù)據(jù)庫(kù)還包含了微生物的分類學(xué)系統(tǒng)關(guān)系樹(shù)的信息。另外，還可以加上每個(gè)物種豐度情況，全面展示物種進(jìn)化關(guān)系和在不同樣本中的豐度差異。

如下圖所示，圖中的支點(diǎn)表示該處在NCBI 數(shù)據(jù)庫(kù)中有相應(yīng)的Taxonomy 記錄，支點(diǎn)出有英文名標(biāo)記物種分類信息，距離越近的菌表示進(jìn)化關(guān)系越近。此外，每個(gè)支點(diǎn)處都有一個(gè)餅狀圖，標(biāo)示不同樣品的相對(duì)豐度差異。圖中四種顏色代表了4個(gè)不同的樣本，在最上面一支中，橙色樣本（sample3）的豐度高于其他樣本。

本站是提供個(gè)人知識(shí)管理的網(wǎng)絡(luò)存儲(chǔ)空間，所有內(nèi)容均由用戶發(fā)布，不代表本站觀點(diǎn)。請(qǐng)注意甄別內(nèi)容中的聯(lián)系方式、誘導(dǎo)購(gòu)買等信息，謹(jǐn)防詐騙。如發(fā)現(xiàn)有害或侵權(quán)內(nèi)容，請(qǐng)點(diǎn)擊一鍵舉報(bào)。

轉(zhuǎn)藏 分享

QQ空間 QQ好友新浪微博微信

獻(xiàn)花（0） +1

來(lái)自：高六博 > 《微生物組》

舉報(bào)/認(rèn)領(lǐng)