日韩黑丝制服一区视频播放|日韩欧美人妻丝袜视频在线观看|九九影院一级蜜桃|亚洲中文在线导航|青草草视频在线观看|婷婷五月色伊人网站|日本一区二区在线|国产AV一二三四区毛片|正在播放久草视频|亚洲色图精品一区

分享

16s擴增子測序分析全流程詳解

 劉得光3p6n6zqq 2021-09-29

圖片

擴增子測序是一種高靶向性方法(對特定長度的PCR產(chǎn)物或者捕獲的片段進行測序),用于分析特定基因組區(qū)域中的基因變異。PCR產(chǎn)品(擴增子)的超深度測序可以有效地識別變異并對其進行特征分析。總體思路是靶向地捕獲目標區(qū)域,然后進行新一代測序(NGS),分析測序結(jié)果,得到相應(yīng)信息。

根據(jù)研究目的不同擴增子測序可細分為16S rDNA測序、18S rDNA測序、ITS測序及目標區(qū)域擴增子測序等。下面小編對二代16S rDNA測序分析流程做一個詳細介紹。

  實驗流程  

 

提取樣品總DNA后,根據(jù)保守區(qū)設(shè)計得到引物,在引物末端加上測序接頭,進行PCR擴增并對其產(chǎn)物進行純化、定量和均一化形成測序文庫,建好的文庫先進行文庫質(zhì)檢,質(zhì)檢合格的文庫用Illumina HiSeq 2500進行測序。高通量測序(如Illumina HiSeq等測序平臺)得到的原始圖像數(shù)據(jù)文件,經(jīng)堿基識別(Base Calling)分析轉(zhuǎn)化為原始測序序列(Sequenced Reads),結(jié)果以FASTQ(簡稱為fq)文件格式存儲,其中包含測序序列(Reads)的序列信息以及其對應(yīng)的測序質(zhì)量信息。

圖片

生信分析流程

1
數(shù)據(jù)預(yù)處理

根據(jù)PE reads之間的Overlap關(guān)系,將Hiseq測序得到的雙端序列數(shù)據(jù)拼接 (Merge)成一條序列Tags,同時對Reads的質(zhì)量和Merge的效果進行質(zhì)控過濾。主要有如下3個步驟:

1) PE reads拼接:使用 FLASH v1.2.7軟件,通過overlap對每個樣品的 reads 進行拼接,得到的拼接序列即原始 Tags 數(shù)據(jù)(Raw Tags);

2) Tags過濾:使用 Trimmomatic v0.33軟件,對拼接得到的 Raw Tags進行過濾,得到高質(zhì)量的Tags 數(shù)據(jù)(Clean Tags);

3) 去除嵌合體:使用 UCHIME v4.2軟件,鑒定并去除嵌合體序列,得到最終有效數(shù)據(jù) (Effective Tags)。

2
OTU分析

OTU即分類操作單元,是在系統(tǒng)發(fā)生學研究或群體遺傳學研究中,為了便于進行分析,人為給某一個分類單元(品系,種,屬,分組等)設(shè)置的同一標志。

使用QIIME(version 1.8.0)軟件中的 UCLUST對Tags在97%的相似度水平下進行聚類、獲得OTU,并基于Silva(細菌)和UNITE(真菌)分類學數(shù)據(jù)庫對OTU進行分類學注釋。

圖片

圖1.各樣品OTU個數(shù)分布圖

3
物種注釋及分類學分析

將OTU的代表序列與微生物參考數(shù)據(jù)庫進行比對可得到每個OTU對應(yīng)的物種分類信息,進而在各水平(phylum,class,order,family,genus,species)統(tǒng)計各樣品群落組成,利用QIIME軟件生成不同分類水平上的物種豐度表,再利用R語言工具繪制成樣品各分類學水平下的群落結(jié)構(gòu)圖。

圖片 圖片

圖2.物種分布圖              圖3.物種豐度聚類熱圖

用QIIME軟件挑選出屬分類學水平上豐度最高的OTU的序列作為代表序列,進行多重序列比對并構(gòu)建系統(tǒng)進化樹,然后通過Python語言工具繪制圖形。

圖片

圖4.物種系統(tǒng)進化樹

使用KRONA對物種注釋結(jié)果進行可視化展示,展示結(jié)果中,圓圈從內(nèi)到外依次代表不同的分類級別,扇形的大小代表不同OTU注釋結(jié)果的相對比例。

圖片

圖5.KRONA示意圖

4
Alpha多樣性分析

Alpha多樣性(Alpha diversity)反映的是單個樣品物種豐度(richness)及物種多樣性(diversity),有多種衡量指標:Chao1、Ace、Shannon、Simpson。Chao1和Ace指數(shù)衡量物種豐度即物種數(shù)量的多少。Shannon和Simpson指數(shù)用于衡量物種多樣性,受樣品群落中物種豐度和物種均勻度(Community evenness)的影響。

使用Mothur (version v.1.30) 軟件,對樣品Alpha多樣性指數(shù)進行評估。一般為比較樣品間的多樣性指數(shù),分析時會將樣品所含序列數(shù)進行標準化。

稀釋性曲線(Rarefaction Curve)從樣本中隨機抽取一定數(shù)量的序列,統(tǒng)計這些序列所代表的物種數(shù)目,并以序列數(shù)與物種數(shù)來構(gòu)建曲線,用于驗證測序數(shù)據(jù)量是否足以反映樣品中的物種多樣性,并間接反映樣品中物種的豐富程度。

圖片

圖6.稀釋性曲線圖

利用 Mothur 軟件和R語言工具依據(jù)各樣品的測序量在不同測序深度時的Shannon指數(shù)(反映樣品中微生物多樣性的指數(shù))繪制Shannon多樣性指數(shù)稀釋曲線,以此反映各樣本在不同測序數(shù)量時的微生物多樣性。Shannon index越大則OTU種類越多,物種越豐富,表明樣品中已涵蓋絕大多數(shù)的微生物物種信息。

圖片

圖7.Shannon Index曲線

5
Beta多樣性分析

使用QIIME軟件進行 Beta 多樣性(Beta diversity)分析,比較不同樣品在物種多樣性方面存在的相似程度。Beta多樣性分析主要采用binary jaccard、bray curtis、weighted unifrac(限細菌)、 unweighted unifrac (限細菌)等4種算法計算樣品間的距離從而獲得樣本間的β值?;谶@4種距離矩陣展開的Beta多樣性分析,主要有以下幾點。

1)PCA與PCoA分析:通過一系列的特征值和特征向量進行排序,選擇主要的前幾位特征值,采取降維的思想,找到距離矩陣中最主要的坐標,從而觀察個體或群體間的差異。

圖片

圖8.PCA分析圖

2)NMDS分析:將對象間的相似性或相異性數(shù)據(jù)看成點間距離的單調(diào)函數(shù),在保持原始數(shù)據(jù)次序關(guān)系的基礎(chǔ)上,用新的相同次序的數(shù)據(jù)列替換原始數(shù)據(jù)進行度量型多維尺度分析,用于比對樣本組之間的差異。

圖片

圖9.NMDS分析圖

3)UPGMA分析:基于各樣品序列間的進化信息的差異來計算樣品間的差異,可以反映樣品在進化樹中是否有顯著的微生物群落差異。

4)組間物種差異熱圖:基于OTU-Table和上述4種距離矩陣進行物種聚類,從聚類中可以了解樣品之間的相似性以及各分類水平上的群落構(gòu)成相似性。 

圖片

圖10.UPGMA聚類樹

6
組間差異顯著性分析

組間差異顯著性分析主要用于發(fā)現(xiàn)不同組間具有統(tǒng)計學差異的Biomarker。

7
16S功能基因預(yù)測分析

使用PICRUSt軟件通過比對16S測序數(shù)據(jù)獲得的物種組成信息,推測樣本中的功能基因組成,從而分析不同樣本或分組之間在功能上的差異。

首先需要對生成的OTU-table進行標準化(不同的種屬菌包含的16S拷貝數(shù)不相同);然后,通過每個OTU對應(yīng)的greengene id,即可獲得OTU對應(yīng)的KEGG和COG家族信息,從而計算該KEGG和COG的豐度并從KEGG數(shù)據(jù)庫的信息中獲得Pathway、EC信息、OTU豐度計算各功能類別的豐度。

圖片

圖11.組間KEGG代謝途徑差異分析圖

圖片

圖12.COG功能分類統(tǒng)計圖

    本站是提供個人知識管理的網(wǎng)絡(luò)存儲空間,所有內(nèi)容均由用戶發(fā)布,不代表本站觀點。請注意甄別內(nèi)容中的聯(lián)系方式、誘導(dǎo)購買等信息,謹防詐騙。如發(fā)現(xiàn)有害或侵權(quán)內(nèi)容,請點擊一鍵舉報。
    轉(zhuǎn)藏 分享 獻花(0

    0條評論

    發(fā)表

    請遵守用戶 評論公約

    類似文章 更多