日韩黑丝制服一区视频播放|日韩欧美人妻丝袜视频在线观看|九九影院一级蜜桃|亚洲中文在线导航|青草草视频在线观看|婷婷五月色伊人网站|日本一区二区在线|国产AV一二三四区毛片|正在播放久草视频|亚洲色图精品一区

分享

使用“序列云“檢測基因組復(fù)雜結(jié)構(gòu)變異

 生物_醫(yī)藥_科研 2018-12-15

研究亮點(diǎn)

使用10X 建庫方法和作者開發(fā)的SV分析方法,相比短序列測序能有效檢測基因組中復(fù)雜的結(jié)構(gòu)變異,對癌癥中染色體結(jié)構(gòu)變異難以檢測的問題提供了解決方案。

研究背景

SV包括DNA的缺失、重復(fù)、倒位和易位。由于每種SV都會(huì)影響大范圍的基因組區(qū)域,代表了不同個(gè)體和癌癥基因組中的大部分差異核苷酸,這使得SV在進(jìn)化和疾病方面重要性不言而喻。然而現(xiàn)有的二代短序列數(shù)據(jù)只能找到斷點(diǎn)距離小于片段大?。ㄍǔ?00bp)的非常有限的SV數(shù)目,長距離的SV重建需要能檢測到同一單倍體的長序列,三代的單分子測序雖然滿足這一要求,但其高錯(cuò)誤率、低通量和高成本使其應(yīng)用受限。

建庫時(shí)使用微流體技術(shù)包裹長基因組片段,將每個(gè)液滴中長片段打斷的短序列用同一條碼(barcode)標(biāo)記,從而保留長序列信息。這樣擁有相同barcode的一組短序列稱為“序列云”。利用10X方法建庫,得到擁有相同barcode(即來自同一長序列)的短序列云 ,理論上可以被用于識別、組裝、和重建大范圍復(fù)雜SV,且組合二代測序方法較三代經(jīng)濟(jì)許多。應(yīng)用為此開發(fā)的新方法GROC-SVs,作者研究了肉瘤細(xì)胞系中的染色體碎裂和隨后的SV進(jìn)化過程。發(fā)現(xiàn)比起傳統(tǒng)二代短序列測序,斷點(diǎn)檢測的敏感性大有提高。結(jié)果還表明染色體的重排發(fā)生在拷貝數(shù)擴(kuò)增之前,單核苷酸變異(SNV)和結(jié)構(gòu)變異(SV)并無直接關(guān)系。

研究方法

分析步驟

10X Genomic長片段文庫構(gòu)建及Illumina測序---斷點(diǎn)檢測---斷點(diǎn)序列組裝---對SV進(jìn)行單倍體定相---復(fù)雜事件的全基因組重建---后處理---與短序列方法的驗(yàn)證和比較---進(jìn)化分析。 

樣本來源

從斯坦福組織庫取得來自同一肉瘤塊的7個(gè)不同部位的小塊作為7個(gè)實(shí)驗(yàn)組,標(biāo)記為0、1、2、3、6、9、10,其對照樣本取自同一病人的腎組織。對所有樣本進(jìn)行基于10X和標(biāo)準(zhǔn)短序列方法的測序以進(jìn)行比較。其中短序列方法建庫使用PCR-free方案,可用以精確檢測拷貝數(shù)變異。在進(jìn)化分析中,肉瘤的祖先(起源)樣本來自其他研究。 

GROC-SVs分析原理

簡單來說,GROC-SVs分析主要分為兩個(gè)過程:第一步,將序列云比對回基因組后,對每個(gè)位點(diǎn)和其他位點(diǎn)的barcode相似性進(jìn)行統(tǒng)計(jì)學(xué)定量,并畫出類似圖1a最右邊的斷點(diǎn)圖。同一位置由于覆蓋barcode相似或相同,會(huì)形成圖中的對角線(Diagonal)。而兩個(gè)相差很遠(yuǎn)的位置斷點(diǎn)融合后,由于相同的barcode覆蓋,便會(huì)形成斷點(diǎn)圖對角線以外的散點(diǎn)(Translocation),對每個(gè)位置遍歷這一過程,GROC-SVs就獲得了具有關(guān)聯(lián)性的多個(gè)斷點(diǎn)位置(多個(gè)也說明了SV形成的復(fù)雜性)。第二步,抓取這些斷點(diǎn)位置上的序列,并通過重疊的序列信息得到斷點(diǎn)的先后排列順序,據(jù)此將這些序列組裝起來。最后根據(jù)組裝結(jié)果重建出復(fù)雜SV事件的進(jìn)化圖,如圖1b。

      圖1 GROC-SVs原理示意

圖2展示了第一步的實(shí)際操作過程,斷點(diǎn)處barcode覆蓋了chr1、chr2兩處位置,在坐標(biāo)系上會(huì)通過畫長方形來表示每條barcode的在這兩處位置的相似性。比如用紅色表示的這條序列,在chr1中片段長,chr2覆蓋片段短,那么坐標(biāo)系中長方形在chr1(x軸)的長度就長,在chr2(y軸)長度就短。將這些斷點(diǎn)處序列通過長方形的不同的長寬轉(zhuǎn)換到坐標(biāo)系后,相比起背景顏色,就會(huì)形成一個(gè)三角形的高亮區(qū)。實(shí)際圖(圖3)也展示在了下方,左為肉瘤樣本中的斷點(diǎn),右為同一位置的正常樣本。

圖2 barcode相似性直方圖的說明 

圖3  肉瘤樣本0中的簡單斷點(diǎn)

研究成果

1.復(fù)雜事件重構(gòu)

圖4 a-c顯示了復(fù)雜事件是如何重建的。圖4a展示了6個(gè)擁有相似序列云的連續(xù)斷點(diǎn),圖4b則是這些斷點(diǎn)相應(yīng)的拷貝數(shù)圖譜,通過方法中對這些斷點(diǎn)位置的排列信息而重構(gòu)復(fù)雜事件。不同斷點(diǎn)對應(yīng)的每一行代表一個(gè)云,橙色代表成功分配到確定的單倍體上,黑色代表未分配成功。在非染色體碎裂的細(xì)胞系(HCC1143)中,共檢測到24個(gè)斷點(diǎn),重建出11個(gè)復(fù)雜事件,包括一個(gè)非常大的倒置重復(fù)(圖4 d-f)。這說明序列云在檢測復(fù)雜結(jié)構(gòu)變異的強(qiáng)大能力。

圖4 乳腺癌中的復(fù)雜事件重構(gòu)

 2.全基因組的SV發(fā)現(xiàn),比較和驗(yàn)證

肉瘤基因組擁有大量的結(jié)構(gòu)變異,總共檢測出503個(gè)體細(xì)胞斷點(diǎn)。從circos圖(圖5a)上可看出12號染色體變異密度很高,具有174個(gè)斷點(diǎn)。circos圖最外層代表染色體,其中綠線是指著絲粒位置;往內(nèi)是拷貝數(shù)柱狀圖;最內(nèi)層是拷貝異常示意,紅色代表缺失,藍(lán)色代表擴(kuò)增。洋紅色弧線代表染色體內(nèi)變異事件,藍(lán)色弧線代表染色體間變異。其中a代表祖先樣本中414個(gè)復(fù)雜事件,而b、c分別代表0、10號樣本特有的復(fù)雜事件。從圖中可以看出不同染色體間有大量的SV事件發(fā)生。

10X數(shù)據(jù)檢測的另一個(gè)優(yōu)點(diǎn)在于與標(biāo)準(zhǔn)短序列SV檢測方法相比,它的高物理覆蓋顯著提高信噪比。支持SV的10X片段數(shù)量與序列云配對片段數(shù)目高度相關(guān),從中位數(shù)上說,是短序列方法的3.2倍。對于成功組裝的SV斷點(diǎn)序列來說,驗(yàn)證成功率高達(dá)98.6%。而短序列方法中,驗(yàn)證率只有65.1%。

圖5 全基因組SV的發(fā)現(xiàn)和進(jìn)化分析

3.肉瘤中的基因組進(jìn)化

圖5d顯示了用高置信的SNV位點(diǎn)重建的樣本的進(jìn)化樹。粗斜體表示斷點(diǎn)數(shù)量,正小字表示每個(gè)分支的SNV數(shù)量。每個(gè)樣本按照體細(xì)胞等位基因頻率細(xì)分為亞克?。ㄩL方形中陰影)。所有肉瘤樣本中都出現(xiàn)但未在對照組中發(fā)現(xiàn)的414個(gè)斷點(diǎn)與共同祖先a中414個(gè)一致。并發(fā)現(xiàn)祖先樣本重排后擁有高度擴(kuò)增的典型脂肪肉瘤驅(qū)動(dòng)基因,MDM2。作者確定了幾個(gè)肉瘤樣本中的特有的89個(gè)SV突變,發(fā)現(xiàn)大部分位于5、7、12號染色體,10號樣本中59個(gè)、0號樣本中11個(gè)、3號樣本中3個(gè)的標(biāo)記子克隆SV沒有在其他樣本中發(fā)現(xiàn)。

圖5e顯示了SV和SNV在進(jìn)化樹分支間的數(shù)量對比。圖中虛線表示祖先分支在恒定速率模型下,SV相對于SNV的積累速率。從圖中表明,SV不是按照細(xì)胞分裂數(shù)量成比例積累的,而是在進(jìn)化過程中以爆發(fā)形式聚集,否則圖中的點(diǎn)應(yīng)排列于虛線附近(SNV與數(shù)目與分裂數(shù)量成比例)。從樣本10的SNV和SV數(shù)目可看出,SV數(shù)目和SNV數(shù)目沒有一致性,這表明SV積累是偶然的。從圖3a-c可以發(fā)現(xiàn),祖先樣本中只有30%的染色體間SV變異集中于5、7號染色體間,而b中0號樣本幾乎全部富集于5、7號上。這進(jìn)一步說明SV是爆發(fā)于一個(gè)足夠短的時(shí)間,以至于SNV未積累到足夠水平來觀察到亞克隆。

文章總結(jié)

10X Genomics建庫方法組合二代測序是一種經(jīng)濟(jì)有效的單分子長序列測序方法。本文作者開發(fā)了稱為GROC-SVs的基因組結(jié)構(gòu)變異分析方法,并將其應(yīng)用于10X Genomics 和Iluumina二代測序組合產(chǎn)生的肉瘤數(shù)據(jù)中,取得了良好結(jié)果?,F(xiàn)在的全基因組復(fù)雜SV重建總限制于斷點(diǎn)距離無法不長于插入片段大?。?00bp),而作者結(jié)果顯示約40%的斷點(diǎn)之間距離大于10kb。這也證明了序列云方法的適用性。從進(jìn)化分析結(jié)果來看,除了祖先樣本中的SV外,7個(gè)樣本大部分的SV都不一樣,這說明SV必須發(fā)生在腫瘤進(jìn)化的早期。值得注意的是,10號樣本中SNV為0,而SV數(shù)目較多說明,SV可能由于基因組不穩(wěn)定性的爆發(fā)。


使用10X 和 GROC-SVs方法預(yù)計(jì)未來能在結(jié)構(gòu)變異的檢測中取得重要進(jìn)展。相比起二代短序列測序在檢測SV的準(zhǔn)確性和靈敏度上均有很大提高。從文中的分析可以預(yù)見,這種策略對了解腫瘤間結(jié)構(gòu)進(jìn)化及復(fù)雜變異的重建將取得重大進(jìn)展。雖然二代測序較三代價(jià)格上優(yōu)勢明顯,但10X建庫費(fèi)用仍不便宜。未來大規(guī)模的全基因組SV精確檢測依然有賴于建庫費(fèi)用的下降,這一天相信會(huì)早日到來。

    本站是提供個(gè)人知識管理的網(wǎng)絡(luò)存儲空間,所有內(nèi)容均由用戶發(fā)布,不代表本站觀點(diǎn)。請注意甄別內(nèi)容中的聯(lián)系方式、誘導(dǎo)購買等信息,謹(jǐn)防詐騙。如發(fā)現(xiàn)有害或侵權(quán)內(nèi)容,請點(diǎn)擊一鍵舉報(bào)。
    轉(zhuǎn)藏 分享 獻(xiàn)花(0

    0條評論

    發(fā)表

    請遵守用戶 評論公約

    類似文章 更多