日韩黑丝制服一区视频播放|日韩欧美人妻丝袜视频在线观看|九九影院一级蜜桃|亚洲中文在线导航|青草草视频在线观看|婷婷五月色伊人网站|日本一区二区在线|国产AV一二三四区毛片|正在播放久草视频|亚洲色图精品一区

分享

擴(kuò)增子測序引入假陽性稀有類群干擾對微生物群落多樣性、構(gòu)建機(jī)制及相互作用的研究

 子孫滿堂康復(fù)師 2022-08-26 發(fā)布于黑龍江

青島華大基因研究院、深圳華大生命科學(xué)研究院聯(lián)合中國農(nóng)業(yè)科學(xué)院北京畜牧獸醫(yī)研究所、山東大學(xué)微生物技術(shù)國家重點(diǎn)實(shí)驗(yàn)室、丹麥哥本哈根大學(xué)等單位在Environmental Microbiome(IF6.36)上發(fā)表了題為 “Sequencing introduced false positive rare taxa lead to biased microbial community diversity, assembly, and interaction interpretation in amplicon studies” 的文章。

■ 該研究采用華大智造 DNBSEQ-G400 (MGISEQ-2000)及Illumina NovaSeq 6000兩個(gè)主流測序平臺,對微生物模擬群落、表層海水、紅樹林沉積物、小鼠腸道、牛瘤胃等不同生態(tài)系統(tǒng)的樣本進(jìn)行 16S V4 擴(kuò)增子測序分析,發(fā)現(xiàn)NovaSeq 平臺存在顯著的批次效應(yīng),其由于標(biāo)簽跳躍(index hopping)導(dǎo)致的假陽性或假陰性稀有類群對微生物的群落組成、多樣性、相互作用及群落構(gòu)建機(jī)制等研究造成偏差。

■ 第一作者:賈洋洋、趙圣國
通訊作者:

陳建威 (chenjianwei@genomic.cn)

章文蔚 (zhangww@genomics.cn)

Karsten Kristiansen (kk@bio.ku.dk)

02 研究背景

越來越多的研究表明,低豐度的稀有類群在微生物群落中可能有著重要的生物功能和生態(tài)貢獻(xiàn)。然而,稀有微生物類群的研究受其固有的稀缺性和現(xiàn)有技術(shù)不足的阻礙。過去十年最廣泛使用擴(kuò)增子測序中,焦磷酸測序(pyrosequencing)和Illumina測序可能產(chǎn)生的樣本標(biāo)簽跳躍(index hopping)會引入樣本交叉污染。盡管通過下游質(zhì)量控制和聚類/降噪算法可以消除測序錯(cuò)誤及人工合成序列的污染,但沒有算法可以消除由標(biāo)簽跳躍引入的樣本交叉污染的高質(zhì)量測序數(shù)據(jù),因此難以區(qū)分?jǐn)U增子研究中的真實(shí)或假陽性稀有類群。

根據(jù) Illumina 2017 年發(fā)布的白皮書可知對于各種 Illumina 測序平臺,標(biāo)簽跳躍的發(fā)生率可能為 0.2~6% 甚至更高;而基于DNA納米球滾環(huán)式復(fù)制的 DNBSEQ 測序平臺標(biāo)簽跳躍的發(fā)生率低至 0.0001-0.0004%。不同的測序平臺可能有不同的優(yōu)缺點(diǎn),目前很少研究評估測序產(chǎn)生標(biāo)簽跳躍如何以及在多大程度上會影響對稀有微生物類群的研究。本研究使用兩個(gè)不同的主流測序平臺 DNBSEQ-G400 及 NovaSeq 6000 對來自商業(yè)微生物模擬群落、實(shí)驗(yàn)室自制模擬群落以及具有不同復(fù)雜性的多個(gè)典型生態(tài)系統(tǒng)微生物群落進(jìn)行了測序,以系統(tǒng)地分析標(biāo)簽跳躍如何影響我們對各類微生物群落中稀有類群的認(rèn)識。此外,通過對牛瘤胃微生物群落的真實(shí)案例研究,進(jìn)一步表明了標(biāo)簽跳躍可能導(dǎo)致微生物組成、群落構(gòu)建機(jī)制和稀有微生物的生態(tài)作用等研究結(jié)果存在偏差。

03 實(shí)驗(yàn)設(shè)計(jì)

本研究首先使用已知微生物組成的商業(yè)微生物模擬群落(ZymoBIOMICS? Mock D6305)及兩個(gè)實(shí)驗(yàn)室自制模擬群落(4bac & 7bac)來確認(rèn)不同測序平臺(DNBSEQ-G400, NovaSeq 6000)測序過程中是否存在引入標(biāo)簽跳躍以及在不同平臺上的標(biāo)簽跳躍發(fā)生率(圖 1,Part1)。隨后對來自具有不同群落復(fù)雜度的幾個(gè)典型生態(tài)系統(tǒng)的樣本進(jìn)行測序,通過三次平行測序分析微生物群落檢測結(jié)果的穩(wěn)定性,并檢驗(yàn)標(biāo)簽跳躍如何影響不同環(huán)境樣本的群落多樣性(圖 1,Part2)。最后使用了一組牛瘤胃樣本(47個(gè))進(jìn)行案例研究,通過群落多樣性、構(gòu)建機(jī)制、互作網(wǎng)絡(luò)及理化參數(shù)關(guān)聯(lián)等分析以及假陽性O(shè)TU PCR實(shí)驗(yàn)驗(yàn)證,評估標(biāo)簽跳躍產(chǎn)生的假陽性/假陰性結(jié)果對微生物生態(tài)作用和群落構(gòu)建機(jī)制等結(jié)果的影響(圖 1,Part3)。

04 研究成果

■ DNBSEQ-G400 平臺的批次效應(yīng)及假陽性率更低,NovaSeq 6000 產(chǎn)生的假陽性可能是標(biāo)簽跳躍引入的且無法通過QC去除
為了評估可能由擴(kuò)增子測序中的標(biāo)簽跳躍引入的假陽性率,我們使用已知組成的商業(yè)微生物模擬群落(Mock D6305,含8種已知細(xì)菌)和分別包含4種已知的細(xì)菌(4bac)、7種細(xì)菌(7Bac)的兩個(gè)實(shí)驗(yàn)室自制模擬群落對 16S V4 進(jìn)行三次平行擴(kuò)增測序(圖 1)。對于商業(yè)Mock,DNBSEQ-G400 共獲得了17個(gè)OTU(每次重復(fù)檢出OTU數(shù)目分別為14、15、16個(gè)),其中3個(gè)OTU只在一次重復(fù)中出現(xiàn),另外14個(gè)OTU在所有三次技術(shù)重復(fù)都有檢測到。與之相比,NovaSeq 6000 共獲得了162個(gè)OTU(每次重復(fù)檢出OTU數(shù)目分別為92、156、66個(gè)),其中僅一次檢出的OTU有67個(gè),兩次檢出的38個(gè),所有三次技術(shù)重復(fù)檢出的57個(gè)。我們發(fā)現(xiàn)NovaSeq平臺的檢測結(jié)果具有顯著的批次效應(yīng),與DNBSEQ的82%重復(fù)檢出率相比,NovaSeq只有35%的OTU能被所有三個(gè)技術(shù)重復(fù)一致地觀察到(圖 2A),對4bac、7bac模擬群落的分析也揭示了相似的觀察結(jié)果。
 OTU的分類注釋顯示,Mock樣本在兩個(gè)測序平臺所有技術(shù)重復(fù)都檢測到了模擬群落的所有目標(biāo)菌株,這表明在給定足夠測序深度的情況下我們可以成功檢測到群落中所有的高豐度微生物。然而盡管兩個(gè)測序平臺都成功檢測到預(yù)期目標(biāo)物種,但兩個(gè)平臺都發(fā)現(xiàn)了一些的與模擬群落組成不一樣的可能是假陽性的 Unexpected OTU,且NovaSeq平臺的 Unexpected OTU 數(shù)量幾乎比 DNBSEQ 平臺高出兩個(gè)數(shù)量級(圖 2B)。NovaSeq和DNBSEQ兩個(gè)平臺的 Unexpected OTU 相對豐度分別為1.19%和0.09%,占測序數(shù)據(jù)的 5.68%和0.08%。我們發(fā)現(xiàn)DNBSEQ平臺檢測到的9個(gè) Unexpected OTUs 也均在NovaSeq平臺檢出,且這9個(gè)OTU中的5個(gè)可能是Mock的細(xì)菌的突變株(序列相似性97.18%~99.60%),其余4個(gè)可能是原始DNA樣本中的潛在污染或分裝過程中來自環(huán)境的污染,表明這9個(gè)共有的 Unexpected OTUs 更有可能來自原始測序DNA樣本,而不是來自各自的測序過程(圖 2B-C)。另一方面,NovaSeq的 Unexpected OTUs 物種多樣性很高,且僅有小部分能在技術(shù)重復(fù)中檢出(圖 2B);同時(shí)在4bac、7bac的NovaSeq測序結(jié)果中也都發(fā)現(xiàn)了很多 Unexpected OTUs,觀察結(jié)果與商業(yè)Mock類似。由于標(biāo)簽跳躍的發(fā)生率較低,因此我們嘗試使用更嚴(yán)格的質(zhì)量控制和更高的OTU聚類豐度閾值來消除標(biāo)簽跳躍產(chǎn)生的污染。然而,即使我們將豐度閾值提高到50也無法消除所有的潛在污染,表明標(biāo)簽跳躍的污染可能無法通過常規(guī)的分析方法去除。

■ 稀有微生物類群更容易受到標(biāo)簽跳躍引物的偏差的影響

由于各類生態(tài)系統(tǒng)的真實(shí)微生物群落在微生物組成和豐度分布上比模擬群落復(fù)雜得多,我們推測標(biāo)簽跳躍可能會導(dǎo)致真實(shí)樣本中出現(xiàn)更有趣的假陽性/假陰性現(xiàn)象。通過 DNBSEQ-G400 和 NovaSeq 6000 平臺對分別來自低、中、高群落多樣性的小鼠腸道、表層海水、紅樹林沉積物等典型微生物生態(tài)系統(tǒng)的樣本進(jìn)行了三次平行測序。對于這些來自不同微生物生態(tài)系統(tǒng)的真實(shí)樣本,每類物種的檢出率與其豐度密切相關(guān)。因此,與稀有類群相比,高豐度的豐富類群捕獲測序及檢出的機(jī)會要高得多。本研究中,我們將相對豐度 ≥1% 的類群定義為豐富類群(Abundant taxa, AT),<0.1% 為稀有類群(Rare taxa, RT),其余為中等類群(Moderate taxa, MT)。對每類生態(tài)系統(tǒng)的三次技術(shù)重復(fù)結(jié)果比較顯示,DNBSEQ-G400 的技術(shù)重復(fù)可以檢測到100%的豐富類群、97.53%中等類群和68.93%稀有分類群,而NovaSeq平臺對應(yīng)比例為100%、87.94%和39.50%(圖 3A)。測序平臺之間的比較顯示,中等和稀有類群的平臺特異類群的比例更高,特別是對于NovaSeq平臺。與 DNBSEQ-G400 平臺的結(jié)果相比,NovaSeq 6000 平臺在海水和小鼠腸道樣本中Alpha 多樣性更高,但在紅樹林樣本中顯著降低(圖 3B)。進(jìn)一步使用紅樹林和小鼠腸道的宏基因組測序數(shù)據(jù)對其OTU進(jìn)行比對定量,發(fā)現(xiàn)NovaSeq平臺有更多的OTU沒有被宏基因組數(shù)據(jù)檢測到,表明其假陽性的風(fēng)險(xiǎn)更高。此外,Beta多樣性分析的 weight & unweight UniFrac 聚類樹一致表明,DNBSEQ-G400 平臺三次技術(shù)重復(fù)均按其所有測試生態(tài)系統(tǒng)的生物樣本分群,而NovaSeq的三次技術(shù)重復(fù)按測序批次或隨機(jī)方式分群,表明其群落結(jié)構(gòu)受測序批次影響大。

■ 牛瘤胃微生物群落不同測序平臺結(jié)果比較

雖然目前已經(jīng)對牛瘤胃生態(tài)系統(tǒng)進(jìn)行了大量研究以闡明微生物的組成和功能多樣性,但以前的大多數(shù)研究都忽略了其中稀有類群。為了研究瘤胃稀有類群的生態(tài)特征,并評估不同測序平臺稀有群落結(jié)果的差異,我們在 DNBSEQ-G400 和 NovaSeq 6000兩個(gè)平臺上對47個(gè)牛瘤胃液樣本進(jìn)行了擴(kuò)增子測序并整合分析。在總共3043個(gè)OTU中,只有12個(gè)是豐富類群,中等和稀有分別為161和2870個(gè)。DNBSEQ和 NovaSeq揭示了幾乎相同的豐富和中等微生物類群,表明這兩個(gè)類群的測序平臺效應(yīng)相對較低(圖 4A)。然而,對于稀有微生物類群,在NovaSeq平臺觀察到了更多的平臺特異類群。在2870個(gè)稀有OTU中,僅在一個(gè)平臺檢測到有913個(gè)(32%),而其中889個(gè)分類多樣的稀有OTU僅在NovaSeq平臺檢出,遠(yuǎn)高于DNBSEQ的24個(gè)(圖 4A)。
NovaSeq平臺特異檢測到的物種多樣的稀有類群會導(dǎo)致樣本Alpha和Beta多樣性結(jié)果受到影響。不同測序平臺Alpha多樣性比較發(fā)現(xiàn)NovaSeq平臺的 Chao I 指數(shù)顯著降低,但其系統(tǒng)發(fā)育多樣性更高,表明其特有的稀有類群比DNBSEQ覆蓋了更廣泛的物種類群。NovaSeq特異的稀有OTU頻率分析表明,超過30%的OTU僅在一個(gè)樣本中出現(xiàn)(圖 5B),這與觀察到的更高的Beta多樣性和更高的整合群落多樣性一致(圖 4A)。此外,NovaSeq 特異檢測到的6個(gè)門(Armatimonadetes, BRC1, Chloroflexi, Genmatinonadetes, Deinococcus thermus, candidate division WPS-2)均不是牛瘤胃系統(tǒng)中常見的微生物類群(圖 4B)。為了進(jìn)一步評估NovaSeq特異的稀有類群是真實(shí)的稀有類群還是在測序過程中引入的假陽性,我們計(jì)算了每個(gè)稀有類群與瘤胃液理化參數(shù)(包括NH4+、乙酸鹽、丙酸鹽、丁酸鹽和異丁酸鹽等)之間的相關(guān)性。假設(shè)是牛瘤胃中真實(shí)的稀有類群,其應(yīng)該與其宿主的發(fā)酵條件相關(guān),與理化參數(shù)相關(guān)的概率高于隨機(jī)引入的假陽性。與NovaSeq平臺檢測到的稀有類群相比,DNBSEQ平臺檢出的稀有類群相關(guān)性比例始終較高,且與每個(gè)理化參數(shù)顯著相關(guān),進(jìn)一步表明了NovaSeq平臺檢測到的假陽性稀有類群比例可能高于DNBSEQ。

■ 標(biāo)簽跳躍會導(dǎo)致微生物群落構(gòu)建機(jī)制研究產(chǎn)生偏差

      
不同生態(tài)系統(tǒng)中微生物群落的構(gòu)建同時(shí)受到隨機(jī)和確定性過程的影響,每個(gè)過程控制不同生態(tài)系統(tǒng)中微生物群落組成的不同部分。了解微生物的群落構(gòu)建機(jī)制對于研究微生物組如何干預(yù)宿主健康至關(guān)重要。然而,大量假陽性/假陰性稀有類群的產(chǎn)生如何影響我們對群落構(gòu)建機(jī)制的解釋與認(rèn)識仍不清楚。我們使用Sloan中性選擇模型以及零模型(null assembly model)對兩個(gè)測序平臺上得到牛瘤胃微生物群落組成結(jié)果進(jìn)行分析,以確認(rèn)隨機(jī)或確定性過程是否在牛瘤胃微生物的群落構(gòu)建過程占主導(dǎo)地位,以及不同的測序平臺是否會導(dǎo)致相似或不同的構(gòu)建機(jī)制。我們發(fā)現(xiàn)微生物群落的Sloan中性模型中性擬合系數(shù)較低(DNBSEQ R2 = 0.321;NovaSeq R2 = 0.360),且兩個(gè)測序平臺的結(jié)果較一致(圖 5A)。此外,估算遷移率 m 廣泛用于評估群落中個(gè)體的隨機(jī)損失將被從整合群落中的漂移物種所取代的概率,這與群落中的繁殖率相反。我們發(fā)現(xiàn) DNBSEQ-G400 的 m 值較 NovaSeq 6000 大(DNBSEQ m = 0.221;NovaSeq m = 0.079),表明了瘤胃微生物群落在同一個(gè)環(huán)境中不同奶牛之間存在潛在的交流。
同時(shí)我們對每個(gè)平臺測序結(jié)果計(jì)算了β-NTI指數(shù) (β-nearest taxon index),以進(jìn)一步區(qū)分牛瘤胃微生物群落構(gòu)建中的確定性和隨機(jī)過程。通過分別統(tǒng)計(jì)隨機(jī)性選擇 (|β-NTI| < 2)、變量選擇 (β-NTI ≥ 2) 和同質(zhì)化選擇 (β-NTI ≤ -2) 解釋的群落構(gòu)建過程(圖 5C),我們發(fā)現(xiàn)與Sloan的中性模型擬合結(jié)果一致,兩個(gè)測序平臺的β-NTI分布表明牛瘤胃微生物群落構(gòu)建同時(shí)受到隨機(jī)和確定性過程的影響。與DNBSEQ相比,NovaSeq平臺的β-NTI值分布范圍更廣,并且僅在NovaSeq結(jié)果中觀察到同質(zhì)化選擇的跡象(圖 5C),而將NovaSeq數(shù)據(jù)特異檢測的OTU刪除后得到了與DNBSEQ平臺相似的β-NTI值分布模式(圖 5C)。

■ 不同測序平臺導(dǎo)致微生物互作網(wǎng)絡(luò)核心物種產(chǎn)生差異

已有很多研究通過樣本間微生物相對豐度的相關(guān)系數(shù)來推斷微生物之間的相互作用。網(wǎng)絡(luò)圖的結(jié)構(gòu)或拓?fù)涮卣骺梢詾閺?fù)雜的微生物間相互作用和共現(xiàn)模式提供寶貴的見解,并可用于識別在群落中核心物種等發(fā)揮重要作用的微生物。因此,我們對假陽性的產(chǎn)生是否會導(dǎo)致對微生物相互作用的誤導(dǎo)甚至錯(cuò)誤解釋進(jìn)行了評估。對每個(gè)測序平臺瘤胃微生物群落構(gòu)建共現(xiàn)相關(guān)性互作網(wǎng)絡(luò),發(fā)現(xiàn)稀有類群對每個(gè)網(wǎng)絡(luò)的節(jié)點(diǎn)均貢獻(xiàn)超過了90%,展示了稀有類群在牛瘤胃中潛在的重要生態(tài)作用(圖 6A)。兩個(gè)平臺的互作網(wǎng)絡(luò)節(jié)點(diǎn)度均服從冪律分布,顯示出無標(biāo)度網(wǎng)絡(luò)的性質(zhì),然而與基于DNBSEQ平臺的網(wǎng)絡(luò)相比,基于NovaSeq平臺的微生物網(wǎng)絡(luò)集成度較低,隨機(jī)移除節(jié)點(diǎn)后其網(wǎng)絡(luò)穩(wěn)定性顯著降低(圖 6B)。雖然來自毛螺菌科(Lachnospiraceae)、梭菌目(Clostridiales)、擬桿菌目(Bacteroidales)和普雷沃氏菌(Prevotella)等微生物在兩個(gè)平臺中都認(rèn)為是核心物種(圖 6C),但DNBSEQ鑒定的兩個(gè)核心物種(木糖假丁酸弧菌Pseudobutyrivibrio xylanivorans,瘤胃琥珀酸菌Succiniclasticum ruminis)均有報(bào)道其在瘤胃系統(tǒng)中發(fā)揮重要的生態(tài)作用,而這兩個(gè)物種并未在NovaSeq的互作網(wǎng)絡(luò)中的占據(jù)核心位置。相反,NovaSeq平臺鑒定出的幾個(gè)核心物種在DNBSEQ平臺上屬于低關(guān)聯(lián)度或未被檢測到(如Nocardia coeliaca,Otu0244)。其中 Nocardia coeliaca 是一種好氧革蘭氏陽細(xì)菌,并不是牛瘤胃中常見的微生物,我們使用專門設(shè)計(jì)的引物對 Nocardia coeliaca 進(jìn)行了PCR驗(yàn)證,僅能獲得弱陽性克隆,其Sanger測序結(jié)果與 Nocardia coeliaca Otu0244 相似性較低,證實(shí)了瘤胃樣本中并不存在Nocardia coeliaca。

05 研究結(jié)論

在擴(kuò)增子研究中,雖然樣本間標(biāo)簽跳躍不會對相對高豐度的類群產(chǎn)生顯著影響,但它可能對稀有群落的分析產(chǎn)生偏差,包括群落組成、多樣性、物種相互作用網(wǎng)絡(luò)、群落構(gòu)建機(jī)制等。從實(shí)驗(yàn)的任何過程中都有引入潛在的污染,包括提取、PCR擴(kuò)增、文庫構(gòu)建、測序及其它操作。由于標(biāo)簽跳躍以隨機(jī)方式發(fā)生,我們假設(shè)適當(dāng)?shù)募夹g(shù)重復(fù)和重復(fù)間詳細(xì)的交叉驗(yàn)證可以減少部分假陽性的OTU,但當(dāng)我們使用NovaSeq測序平臺時(shí),即使對同一批次樣本進(jìn)行技術(shù)重復(fù)測序也可能存在真實(shí)稀有類群的丟失及假陽性稀有微生物的引入,不能保證所有真實(shí)的稀有類群都被一致檢測到。因此當(dāng)重點(diǎn)關(guān)注稀有微生物類群時(shí),應(yīng)謹(jǐn)慎的分析其假陽性及假陰性的可能。同時(shí)正確的設(shè)置陽性和陰性對照,包括空白提取試劑盒,以及數(shù)據(jù)處理過程中適當(dāng)?shù)馁|(zhì)量控制和生物信息學(xué)算法,也可用于消除潛在的污染。此外,建議使用具有低標(biāo)簽跳躍率和足夠測序深度的適當(dāng)測序平臺來提高稀有類群檢測和下游生物生態(tài)機(jī)制解釋的準(zhǔn)確性。尤其在關(guān)注稀有微生物類群的研究中,高標(biāo)簽跳躍(index hopping)率不僅會通過樣本交叉污染引入假陽性稀有類群,同時(shí)真實(shí)的稀有類群也可能通過標(biāo)簽跳躍丟失造成假陰性結(jié)果,因此我們建議使用不同的測序技術(shù)對擴(kuò)增子測序結(jié)果進(jìn)行交叉驗(yàn)證。


快速找到人體的各個(gè)穴位 <wbr>365篇

快速找到人體的各個(gè)穴位 <wbr>365篇

    本站是提供個(gè)人知識管理的網(wǎng)絡(luò)存儲空間,所有內(nèi)容均由用戶發(fā)布,不代表本站觀點(diǎn)。請注意甄別內(nèi)容中的聯(lián)系方式、誘導(dǎo)購買等信息,謹(jǐn)防詐騙。如發(fā)現(xiàn)有害或侵權(quán)內(nèi)容,請點(diǎn)擊一鍵舉報(bào)。
    轉(zhuǎn)藏 分享 獻(xiàn)花(0

    0條評論

    發(fā)表

    請遵守用戶 評論公約

    類似文章 更多