http://www./Article/zyyd/yjsj/144070515.html Desheng Liang,* Ying Peng,* Weigang Lv,* Linbei Deng,* Yanghui Zhang,* Haoxian Li,* Pu Yang,* Jianguang Zhang,? Zhuo Song,? Genming Xu,? David S. Cram,? and Lingqian Wu* 醫(yī)學(xué)遺傳學(xué)國(guó)家重點(diǎn)實(shí)驗(yàn)室,*中南大學(xué),湖南長(zhǎng)沙;北京貝瑞和康生物技術(shù)有限公司,?北京,中國(guó) 錄用日期:2014年5月16日 通訊作者:鄔玲仟,博士,中南大學(xué)醫(yī)學(xué)遺傳學(xué)國(guó)家重點(diǎn)實(shí)驗(yàn)室
摘要:檢測(cè)染色體拷貝數(shù)變異(copy number variation,CNV)在臨床癥狀診斷不明和識(shí)別胎兒染色體疾病方面具有重要作用。目前,結(jié)合微陣列技術(shù)的染色體核型分析是臨床檢測(cè) CNV的金標(biāo)準(zhǔn)。為了提高 CNV 檢測(cè)的可行性并降低檢測(cè)費(fèi)用,我們推測(cè)第二代測(cè)序技術(shù)靈敏度和特異性與微陣列技術(shù)相當(dāng),可用于 CNV 檢測(cè)。本研究同時(shí)采用中等密度單核苷酸多態(tài)性微陣列技術(shù)(single nucleotide polymorphism array,SNP array)和低覆蓋度大規(guī)模平行測(cè)序技術(shù)(CNV sequencing, CNV-seq)對(duì)患者樣本進(jìn)行分析,配合 mate-pair 測(cè)序?qū)?nbsp;CNV-seq 檢測(cè)到的 CNV 斷裂點(diǎn)進(jìn)行確認(rèn)。CNV-seq 的最佳 DNA 檢測(cè)樣本量為 50 ng,而樣本量低至 10 ng 也可實(shí)現(xiàn)準(zhǔn)確的 CNV 檢測(cè)。對(duì)微小 CNV 樣本進(jìn)行驗(yàn)證研究,結(jié)果顯示 CNV-seq 技術(shù)具有良好的特異性及可重復(fù)性,其檢測(cè)分辨率約為 0.1Mb。對(duì) 72 個(gè)已由 SNP Array 檢測(cè)過的樣本進(jìn)行 CNV-seq 盲測(cè),發(fā)現(xiàn) CNV-seq 與 SNP Array 具有較高的檢測(cè)一致性。由此認(rèn)為,CNV-seq 可作為微陣列技術(shù)的替代方法用于染色體疾病檢測(cè)。(J Mol Diagn 2014, 16: 519e526; http://dx./10.1016/j.jmoldx.2014.05.002) 人類已知的染色體疾病有200多種1。大多數(shù)染色體疾病由染色體數(shù)目異常引起,以唐氏綜合征最為普遍。另有部分染色體疾病因缺失或重復(fù)一段染色體片段(拷貝數(shù)變異,copy number variations,CNVs)而引起,統(tǒng)稱為染色體微缺失/微重復(fù)綜合征。
染色體疾病臨床表型多樣,表現(xiàn)為多發(fā)性先天畸形、肢體殘疾、發(fā)育遲緩、智力障礙、癲癇癥、自閉癥和學(xué)習(xí)障礙等1-3。近期對(duì)人類配子和植入前胚胎的研究揭示4-6,患者固有的染色體不穩(wěn)定性是其染色體發(fā)生異常的主要原因。CNV的形成與眾所周知的非同源末端連接,以及新近提出的DNA 復(fù)制擾動(dòng)和不連續(xù) DNA 復(fù)制有關(guān)。多種機(jī)制共同作用,原發(fā)性CNV的形成速度遠(yuǎn)遠(yuǎn)超過其他類型的基因變異7。同時(shí)一些發(fā)生率低、但影響顯著的染色體變異持續(xù)通過家族遺傳得以傳播1。通常,大多數(shù)原發(fā)性或繼承性的染色體異常發(fā)生時(shí),胎兒仍可發(fā)育至足月,導(dǎo)致約0.3%的染色體疾病患兒出生8。 過去 30 年,產(chǎn)前診斷對(duì)早、中孕期的染色體異常檢測(cè)起關(guān)鍵作用,選擇性終止妊娠可減少新生兒中染色體疾病的發(fā)病率1。產(chǎn)前診斷需針對(duì)胎兒進(jìn)行一系列分析,包括母體血清學(xué)篩查和超聲檢測(cè)。對(duì)于疑似染色體疾病的胎兒,后續(xù)診斷通過絨毛膜取樣或羊膜穿刺術(shù)進(jìn)行核型分析。核型分析檢測(cè)超過20個(gè)的細(xì)胞分裂中期細(xì)胞,分辨率約為5Mb,是目前檢測(cè)胎兒染色體非整倍體、多倍體、平衡和非平衡性結(jié)構(gòu)重排、較大片段的微缺失/微重復(fù),以及嵌合體的金標(biāo)準(zhǔn)9-11。其他方法如熒光原位雜交(fluorescence in situ hybridization,F(xiàn)ISH)12、熒光定量聚合酶鏈?zhǔn)椒磻?yīng)(polymerase chain reaction,PCR)13和多重連接探針擴(kuò)增技術(shù)14(multiplex ligation-dependent probe amplification,MLPA)也被用于胎兒染色體非整倍體的快速檢測(cè)。最近,高分辨率寡核苷酸和單核苷酸多態(tài)性微陣列技術(shù)(single nucleotide polymorphism array,SNP array)也被用于產(chǎn)前診斷,并為其帶來巨大變革15。與其他技術(shù)相比,SNP array 能在更廣范圍內(nèi)進(jìn)行染色體異常的檢測(cè),可發(fā)現(xiàn)具有臨床意義的、小于 5 Mb 的染色體微缺失/微重復(fù)16。
在臨床應(yīng)用中,微陣列芯片通常需定制,采用高密度寡核苷酸或 SNP 探針均勻覆蓋每條染色體以及致病基因的外顯子區(qū)域3,16,17。結(jié)合雙寡核苷酸的 SNP array 也被用于染色體分析,其分辨率更高,可額外檢測(cè)出寡核苷酸微陣列未能檢測(cè)到的、具有臨床意義的染色體異常18,19。此外,根據(jù)公共數(shù)據(jù)庫(kù)中詳盡的染色體異常及相關(guān)臨床表型信息,使用定制微陣列芯片檢測(cè) CNVs 易于實(shí)現(xiàn)準(zhǔn)確的臨床檢測(cè)20,可對(duì)更加復(fù)雜的綜合征(如自閉癥)進(jìn)行深入的遺傳基礎(chǔ)研究21。然而,對(duì)某些罕見的、數(shù)據(jù)庫(kù)中未涵蓋的 CNVs,仍無(wú)法實(shí)現(xiàn)可靠的診斷22。相比核型分析,基因微陣列技術(shù)能夠額外檢測(cè)到 5% ~ 15% 的染色體異常16,23,但在檢測(cè)多倍體和平衡易位方面,基因微陣列技術(shù)仍存在難度。一項(xiàng)關(guān)于低危和高危妊娠的研究顯示,微陣列可作為檢測(cè)胎兒染色體異常的主要技術(shù)加以運(yùn)用24。
在西方國(guó)家,聯(lián)合應(yīng)用超聲、核型分析以及微陣列技術(shù)已對(duì)識(shí)別妊娠期胎兒染色體異常、詮釋習(xí)慣性流產(chǎn),以及診斷兒童和成人未知生理和心理問題產(chǎn)生重大影響,可為提高其生活質(zhì)量提供更好的治療方案16,25,26。但在發(fā)展中國(guó)家和一些發(fā)達(dá)國(guó)家,微陣列技術(shù)因技術(shù)難度高、缺少專業(yè)知識(shí)和高成本等尚未得到廣泛運(yùn)用,故而新生兒染色體疾病發(fā)病率仍很高27-29。目前,臨床上亟需微陣列技術(shù)的替代方法,以便全面準(zhǔn)確、經(jīng)濟(jì)實(shí)惠地檢測(cè)大多數(shù)染色體疾病。我們推測(cè)基于第二代測(cè)序技術(shù)的CNV-seq有望滿足這一需求。
我們之前的研究結(jié)果顯示采用低覆蓋度鳥槍測(cè)序法分析約500萬(wàn)條的測(cè)序序列,以每條染色體上連續(xù)的20kb基因組為測(cè)序單元(bin),可檢測(cè)5%的X染色體嵌合體30。我們推測(cè)這一方法同樣適用于22對(duì)常染色體以及 X、Y兩條性染色體的高分辨率 CNV 檢測(cè)。本研究采用CNV-seq檢測(cè)受檢樣本,其染色體異常均由SNP array確認(rèn),結(jié)果表明,CNV-seq 與 SNP array 具有高度的檢測(cè)一致性,且CNV-seq重復(fù)性好、靈敏度高,分辨率約 0.1 Mb。
材料與方法
受檢樣本 核型分析和SNP array在中南大學(xué)醫(yī)學(xué)遺傳學(xué)國(guó)家重點(diǎn)實(shí)驗(yàn)室和湖南家輝遺傳專科醫(yī)院進(jìn)行。入選樣本共72例,62例來自于發(fā)育遲緩、智力障礙或先天畸形患者,10例來自于流產(chǎn)組織,詳細(xì)情況見補(bǔ)充材料(表S1)。另有3例環(huán)狀染色體樣本和4例微小CNVs樣本(小于 0.25 Mb)用于評(píng)估 CNV-seq的檢測(cè)靈敏度和特異性。使用Qiagen公司生產(chǎn)的 DNeasy Blood & Tissue Kit試劑盒,提取患者血液和流產(chǎn)組織中的DNA,瓊脂糖凝膠電泳后,使用Thermo Fisher Scientific 公司生產(chǎn)的 NanoDrop 分光光度計(jì),評(píng)估 DNA 樣品的質(zhì)量和濃度。
SNP array 使用 Illumina 公司生產(chǎn)的 HumanCytoSNP-12 BeadChip芯片進(jìn)行染色體 CNV 分析,SNP 探針密度為 298,563,基因組平均間距為 19 kb。使用 Illumina 公司的 GenomeStudio 軟件(版本 2011.1)計(jì)算 log R 值以及 A 和 B 等位基因頻率值。使用Illumina 公司的 cnvPartiion 軟件插件(版本 v3.1.6)進(jìn)行詳細(xì)的 CNV 分析。CNV重復(fù)(AAA,AAB,ABB 和 BBB 等位基因組合)和缺失(A 或 B 等位基因)定義為50 個(gè) SNP 區(qū)域中置信度得分 >100。
CNV-seq 將 50 ng 基因組 DNA 進(jìn)行片段化處理,獲得平均大小為 300 bp 的DNA片段,參照文獻(xiàn)方法構(gòu)建測(cè)序文庫(kù)31,32,使用 Illumina 公司的 HiSeq 2000平臺(tái)進(jìn)行測(cè)序,36bp單端測(cè)序,測(cè)序深度0.1倍,產(chǎn)生800萬(wàn)條的測(cè)序序列。使用 Burrows-Wheeler 算法將所有測(cè)序序列與hg19基因組進(jìn)行比對(duì)分析33。根據(jù)文獻(xiàn)記載的數(shù)據(jù)處理和分析算法30,將最少 20 個(gè)測(cè)試樣本進(jìn)行內(nèi)部比較,互相作為參考。為了提高檢測(cè)靈敏度,以60Kb為基本測(cè)序單元,對(duì)大約500萬(wàn)條測(cè)序序列進(jìn)行分析。以標(biāo)準(zhǔn)化測(cè)序讀取密度的 log2 值為y軸,以相對(duì)連續(xù)的60kb測(cè)序單元為x 軸,繪制CNV-seq檢測(cè)結(jié)果圖。然后,依據(jù)每條染色體的長(zhǎng)度計(jì)算 log2 平均值。染色體拷貝數(shù)重復(fù)(3個(gè)拷貝)的log2 理論值為log2 [1.5] = 0.58;染色體拷貝數(shù)缺失(1個(gè)拷貝)的log2 理論值為log2 [0.5] = -1.0。將CNV-seq檢測(cè)拷貝數(shù)重復(fù)的cut-off值設(shè)為 >2.8(log2 [1.4] = 0.49),拷貝數(shù)缺失的cut-off值設(shè)為 <1.2(log2 [0.6] = 0.74)。
Mate-pair 測(cè)序 使用 Illumina 公司的 Nextera Mate-Pair Sample Preparation Kit 進(jìn)行 mate-pair 測(cè)序。先將5μg基因組 DNA 進(jìn)行片段化處理,然后將DNA片段溶于1%的瓊脂糖凝膠,再用 Qiagen 公司的 QIAquick Gel Extraction Kit 對(duì) 5 kb 大小的 DNA 組分進(jìn)行純化。使用 HiSeq 2000對(duì)文庫(kù)進(jìn)行測(cè)序,產(chǎn)生成對(duì)的正反向約為 100 bp 的測(cè)序序列,然后使用 Burrows-Wheeler 算法將這些測(cè)序序列唯一比對(duì)到 hg19 參照基因組中33。共有10-2,500 萬(wàn)個(gè)測(cè)序序列用來識(shí)別至少一個(gè)成對(duì)的染色體斷裂點(diǎn)。
結(jié)果與分析 CNV-seq 對(duì)低樣本量 的檢測(cè)效果 本研究小組在以往的研究中證實(shí),當(dāng)用于構(gòu)建文庫(kù)的初始DNA量為100ng時(shí),CNV-seq可取得與核型分析一致的檢測(cè)結(jié)果30。考慮到臨床樣本DNA量的可變性,本研究對(duì)正常樣本(46,XX)和Wolf-Hirschhorn syndrome樣本(46,XX,4p16.1-pter;8.92Mb缺失)進(jìn)行低樣本量的CNV-seq檢測(cè),以驗(yàn)證CNV-seq的臨床適用性。分別重復(fù)46,XX和46,XX,4p16.1-pter樣本量為10ng和50ng的CNV-seq檢測(cè)(圖1,46,XX和46,XX,4p16.1-pter樣本量分別為10ng和50ng的4號(hào)染色體CNV-seq結(jié)果圖;補(bǔ)充材料圖S1和S2,46,XX,4p16.1-pter樣本量為50ng時(shí)所有染色體的 CNV-seq結(jié)果圖)。樣本量為50ng時(shí),CNV-seq對(duì)46,XX 樣本和46,XX,4p16.1-pter樣本的正常染色體檢測(cè)均未發(fā)現(xiàn)顯著的CNV,46,XX,4p16.1-pter樣本也在4p16.1-pter 區(qū)段觀察到預(yù)期的拷貝數(shù)缺失。與之相反,樣本量為10ng時(shí),46,XX正常樣本或46,XX,4p16.1-pter異常樣本的CNV-seq結(jié)果圖表現(xiàn)出輕微的不穩(wěn)定性,部分染色體表現(xiàn)出輕微的非特異性 CNV 波動(dòng),染色體末端區(qū)域表現(xiàn)顯著。而在46,XX,4p16.1-pter異常樣本中,還觀察到比 4p16.1-pter 區(qū)域稍小的拷貝數(shù)缺失?;谝陨戏治?,50ng為最佳的 CNV-seq檢測(cè)樣本量,可產(chǎn)生 800 萬(wàn)條測(cè)序序列。
圖 1 CNV-seq 對(duì)低樣本量的檢測(cè)效果。圖為 46,XX和46,XX,4p16.1-pter樣本量分別為10ng和50ng的4號(hào)染色體CNV-seq結(jié)果圖。CNV-seq 結(jié)果圖以標(biāo)準(zhǔn)化測(cè)序讀取密度的 log2 值為y 軸,以相對(duì)連續(xù)的60 kb 測(cè)序單元為x 軸。上虛線 [log2 (3/2)] 和下虛線 [log2 (1/2)] 分別表示100%染色體增加(重復(fù))和100%染色體減少(缺失)。CNV區(qū)域、重復(fù)序列區(qū)域和著絲粒區(qū)域分別用藍(lán)色線條、紅色方框和黑色方框表示。箭頭對(duì)應(yīng)4p16.1-pter區(qū)域8.92 Mb的缺失,50 ng樣本量檢測(cè)效果更佳。
CNV-seq 的特異性和可重復(fù)性 在對(duì)樣本的檢測(cè)中,CNV-seq偶爾檢出一些大小為幾百Kb的微缺失/微重復(fù)。為了驗(yàn)證這些微小 CNVs 是否真實(shí)存在,以及CNV-seq 對(duì)真正CNVs檢測(cè)的特異性,我們使用 mate-pair 測(cè)序來確認(rèn)和精確定位兩個(gè)已測(cè)樣本的缺失和斷裂位點(diǎn)。其中一個(gè)樣本Xp22.2區(qū)段缺失0.22 Mb,可能導(dǎo)致 PLP1 基因缺失和 X 連鎖佩梅?。≒elizaeus-Merzbacher disease);另一個(gè)樣本6q26區(qū)段純合性缺失0.08Mb,可能與帕金森?。≒arkinson disease)PARK2基因缺失有關(guān)。mate-pair 測(cè)序至少檢測(cè)出兩個(gè)樣本跨越斷裂點(diǎn)的5kb DNA片段(圖2和圖3)?;谏鲜?nbsp;mate-pair 測(cè)序結(jié)果,設(shè)計(jì)引物擴(kuò)增包含兩個(gè)斷裂點(diǎn)的小片段 DNA,運(yùn)用Sanger測(cè)序法將疑似基因斷裂點(diǎn)精確定位到單核苷酸水平,結(jié)果證實(shí),最初由 CNV-seq 檢測(cè)到的兩個(gè)缺失真正存在。
圖2 Mate-pair 測(cè)序確認(rèn)由 CNV-seq 識(shí)別出的兩個(gè)缺失的斷裂點(diǎn)(Xp22.2區(qū)段缺失0.22 Mb和6q26區(qū)段缺失0.08 Mb)。根據(jù)橫跨缺失區(qū)域的 5 kb 片段 mate-pair 測(cè)序結(jié)果,以 hg19 作為參考基因組定義缺失區(qū)域的近似坐標(biāo),并在斷裂點(diǎn)的任一側(cè)設(shè)計(jì) PCR 引物。Sanger 測(cè)序法確定缺失片段大小,并將斷裂點(diǎn)定位到單核苷酸(箭頭)水平。由此確認(rèn),X 連鎖佩梅病和帕金森病疑似患者中的 Xp22.2 區(qū)段和 6q26區(qū)段 缺失分別由 PLP1 和 PARK2 基因序列的全部或部分缺失引起。
為了確定能否重復(fù)檢測(cè)上述兩種微小 CNVs,我們使用3份 50 ng 基因組DNA重復(fù)檢測(cè)。結(jié)果發(fā)現(xiàn),三次mate-pair 測(cè)序均可發(fā)現(xiàn)Xp22.2區(qū)段0.22Mb的缺失和6q26區(qū)段0.08Mb的缺失,且CNV缺失的拷貝數(shù)也符合預(yù)期(圖3)。后續(xù)分析另外兩個(gè)基因組 DNA 樣本,第一個(gè)樣本顯示22q11.2 區(qū)段缺失0.24 Mb,查詢OMIM數(shù)據(jù)庫(kù)顯示,缺失導(dǎo)致3個(gè)非致病基因(IGLL3P,LRP5L 和 CRYBB2P1)半合子表達(dá)。第二個(gè)樣本顯示9q33.1區(qū)段缺失0.22 Mb,查詢OMIM數(shù)據(jù)庫(kù)顯示,缺失導(dǎo)致致病基因TRIM32半合子表達(dá)。在兩個(gè)DNA樣本的預(yù)期位置均重復(fù)檢測(cè)到單個(gè)CNV(數(shù)據(jù)未示出)。由此可知應(yīng)用CNV-seq檢測(cè)微小 CNVs 具有良好的特異性和重復(fù)性。
圖3 CNV-seq 對(duì)微小 CNV 的重復(fù)性試驗(yàn)。三個(gè)重復(fù)樣本的 CNV 結(jié)果圖均顯示Xp22.2區(qū)段0.22Mb的缺失和6q26區(qū)段0.08Mb的缺失 。CNV-seq 結(jié)果圖以標(biāo)準(zhǔn)化測(cè)序讀取密度的 log2 值為y 軸,以相對(duì)連續(xù)的60 kb 測(cè)序單元為x 軸。上虛線 [log2 (3/2)] 和下虛線 [log2 (1/2)] 分別表示100%染色體增加(復(fù)制)和100%染色體減少(缺失)。CNV區(qū)域、重復(fù)序列區(qū)域和著絲粒區(qū)域分別用藍(lán)色線條、紅色方框和黑色方框表示。三個(gè)重復(fù)樣本中的兩個(gè)缺失(箭頭)均被 CNV-seq 重復(fù)檢測(cè)到,且CNV倍性符合預(yù)期。
驗(yàn)證CNV-seq 檢測(cè)染色體疾病的臨床適用性 為了評(píng)估 CNV-seq 在染色體疾病綜合診斷中的適用性,我們對(duì)72例經(jīng)由SNP array確認(rèn)過的樣本進(jìn)行CNV-seq分析(個(gè)別樣本的保存期已超過 5 年)。檢測(cè)過程為雙盲檢測(cè),CNV-seq 結(jié)果與SNP array 結(jié)果進(jìn)行比較(數(shù)據(jù)概況見表1,完整數(shù)據(jù)見補(bǔ)充表S1)。文章分析了11例樣本的CNV-seq和SNP array比較結(jié)果,其中4例見圖4, 另外7例見補(bǔ)充圖 S3。CNV-seq對(duì) 72 例樣本的檢測(cè)結(jié)果與SNP array完全一致(表 1 和 補(bǔ)充表 S1),其中致病CNVs 43例(60%)。此外,CNV-seq 還檢測(cè)到5例未被SNP array 檢出的小于 1 Mb 的次級(jí) CNVs(0.20 ~ 0.6 Mb),其臨床意義未知。在所有診斷一致的樣本中,染色體微缺失/微重復(fù)的性質(zhì)、大小以及染色體異常的位置, SNP array 和 CNV-seq 結(jié)果幾乎相同,也與核型分析結(jié)果基本一致。上述結(jié)果表明,CNV-seq 可做為染色體疾病的檢測(cè)方法,其檢測(cè)效果與 SNP array相當(dāng)。
圖 4 比較 SNP array 和 CNV-seq 對(duì)四種染色體疾病的檢測(cè)結(jié)果。兩種方法測(cè)定的染色體位置和 CNVs 大小基本相同。各個(gè) CNV 的詳細(xì)信息見補(bǔ)充表 S1。
CNV-seq 檢測(cè)環(huán)狀染色體缺失
為了驗(yàn)證 CNV-seq 是否能夠檢測(cè)其他類型的染色體異常,CNV-seq重新分析一組經(jīng)由核型分析證實(shí)具有環(huán)狀染色體結(jié)構(gòu)(14號(hào)、22號(hào) 和 18 號(hào)染色體,圖 5)的樣本。CNV-seq 分析發(fā)現(xiàn)14號(hào)染色體q 端缺失3.2 Mb,22號(hào)染色體q 端缺失7Mb,18號(hào)染色體p端缺失2.5 Mb ,q端缺失15.7 Mb(圖5),上述缺失是環(huán)狀染色體形成過程中隨機(jī)末端缺失導(dǎo)致的結(jié)果。對(duì)于 18 號(hào)環(huán)狀染色體,CNV-seq 清楚地檢測(cè)到兩個(gè)符合預(yù)期的 p端 和 q端 缺失,缺失的大小也被精確識(shí)別,映射環(huán)狀染色體的形成過程。不過CNV-seq 不能映射 14p 和 22p的 缺失。
圖 5 CNV-seq 對(duì)14號(hào)、22號(hào)和 18 號(hào)環(huán)狀染色體的檢測(cè)結(jié)果。圖中顯示 CNV-seq 和匹配的核型分析結(jié)果。CNV-seq 結(jié)果圖以標(biāo)準(zhǔn)化測(cè)序讀取密度的 log2 值為y 軸,以相對(duì)連續(xù)的60 kb 測(cè)序單元為x 軸。上虛線 [log2 (3/2)] 和下虛線 [log2 (1/2)] 分別表示100%染色體增加(復(fù)制)和100%染色體減少(缺失)。CNV區(qū)域、重復(fù)序列區(qū)域和著絲粒區(qū)域分別用藍(lán)色線條、紅色方框和黑色方框表示。CNV-seq 可精確映射和測(cè)量終端斷裂點(diǎn)。
討論 本研究評(píng)估了CNV-seq對(duì)染色體疾病檢測(cè)的可靠性和準(zhǔn)確性。通過檢測(cè) 72 例經(jīng)由 SNP array 確診的樣本,發(fā)現(xiàn) CNV-seq 可取得與 SNP array 完全一致的檢測(cè)結(jié)果。同時(shí),CNV-seq 檢測(cè)到5例未被 SNP array檢出的次級(jí) CNVs(<1 Mb)。對(duì)這5例次級(jí) CNVs分析發(fā)現(xiàn),CNV 區(qū)間缺少可供分析的 SNPs 導(dǎo)致SNP array未能檢出??傮w而言,CNV-seq 可準(zhǔn)確檢測(cè)全部或部分染色體非整倍體、微缺失/微重復(fù)(<1 Mb),以及環(huán)狀染色體。此外,CNV-seq 可檢測(cè) 0.1 Mb 的雜合性和純合性缺失,且這些微小缺失經(jīng)mate-pair 測(cè)序確認(rèn)真實(shí)存在。由此可知,CNV-seq 可用于檢測(cè)具有臨床意義的染色體疾病,且具有高度的靈敏度和特異性。
CNV-seq 需在基因組覆蓋度和分辨率之間實(shí)現(xiàn)平衡,且檢測(cè)染色體疾病需經(jīng)濟(jì)有效。為此,我們將測(cè)序序列產(chǎn)出設(shè)定為 500 萬(wàn)條,同時(shí)以連續(xù)的60 kb 為基本測(cè)序單元,每條序列的平均讀長(zhǎng)為 150 ~ 165bp。盡管相同或不同樣本間每個(gè)測(cè)序單元讀取的序列具有隨機(jī)性,但CNV-seq 仍能精確檢測(cè)一系列具有臨床意義的 CNVs。雖然有必要對(duì) CNV-seq 進(jìn)行全基因組水平驗(yàn)證,但本研究表明,CNV-seq可能適用于整個(gè)基因組范圍的 CNV 分析(p 臂近著絲粒的高度重復(fù)區(qū)域、Y染色體q端異染色質(zhì)區(qū)域、著絲粒序列以及其他包含重復(fù)序列的區(qū)域除外)16。此外,CNV-seq 檢測(cè)獲得的 CNV 區(qū)域坐標(biāo)和 SNP array結(jié)果高度一致。
由于 CNV-seq 的高性能,我們推測(cè)第二代測(cè)序技術(shù)更優(yōu)于SNP array。本研究還發(fā)現(xiàn),CNV-seq 可檢測(cè)出與 X 連鎖佩梅病相關(guān)的 PLP1 基因 0.22 Mb 的缺失,以及與帕金森病相關(guān)的 PARK2 基因0.08 Mb 的純合性缺失。因此,CNV-seq 有可能發(fā)現(xiàn)0.1 Mb 缺失引起的常染色體隱性遺傳、X 連鎖和常染色體顯性遺傳疾病。另一方面,寡核苷酸微陣列芯片可根據(jù)已知致病基因的外顯子區(qū)域設(shè)計(jì)探針,對(duì)涉及一個(gè)或多個(gè)外顯子缺失的遺傳病進(jìn)行單基因檢測(cè),檢測(cè)范圍可從染色體疾病擴(kuò)展至單基因病16,19。另外,SNP array 可根據(jù)特異性點(diǎn)突變、微小缺失、插入等設(shè)計(jì)SNP 探針,進(jìn)一步擴(kuò)大其檢測(cè)單基因病的效能17,26。不過目前尚無(wú)單一的微陣列平臺(tái)用于臨床染色體疾病和單基因病的綜合檢測(cè)。對(duì)于已知家族病史的單基因病檢測(cè),除可沿用標(biāo)準(zhǔn)的 PCR 方法外,也可使用二代測(cè)序技術(shù)進(jìn)行全外顯子組檢測(cè)35。相較于寡核苷酸微陣列和 CNV-seq,SNP array 還可通過一系列連續(xù)的 SNP 探針檢測(cè)單親二倍體和判斷血緣關(guān)系16。單親二倍體在新生兒中的發(fā)病率為 0.03%36,最近有研究結(jié)合寡核苷酸和 SNP 平臺(tái)進(jìn)行單親二倍體檢測(cè)18,19。
CNV-seq 可依據(jù)數(shù)據(jù)分析對(duì) CNV實(shí)現(xiàn)量化。本研究CNV-seq識(shí)別的所有染色體重復(fù)和缺失拷貝數(shù)均值 ± 標(biāo)準(zhǔn)誤差分別為 3.0 ± 0.1 和 1.0 ± 0.1,有潛力測(cè)定其他具有臨床意義的CNVs。以往研究發(fā)現(xiàn)CNV-seq 可檢測(cè)性染色體母體嵌合30和胎盤嵌合37,38,本研究進(jìn)一步證實(shí)上述發(fā)現(xiàn)。隨著對(duì)嵌合體認(rèn)識(shí)的日益加深39,CNV-seq 可能成檢測(cè)嵌合體的有效工具,更好詮釋基因型與表型的關(guān)聯(lián)。此外,滋養(yǎng)外胚層囊胚活檢和全基因組擴(kuò)增技術(shù)越來越多地被用于胚胎植入前遺傳學(xué)診斷40,41,CNV-seq 也可特異的檢測(cè)與滋養(yǎng)外胚層細(xì)胞相關(guān)的低水平嵌合42。另外,CNV-seq可精確檢測(cè)低至10ng的樣本,比微陣列技術(shù)更具臨床適用性,可用于分析低樣本量的臨床樣本和寶貴的科研樣本,而微陣列技術(shù)所需的最低樣本量則是其 20 倍。
在許多發(fā)展中國(guó)家,如印度和中國(guó),產(chǎn)前診斷仍主要依賴于胎兒染色體核型分析、母血清學(xué)篩檢和超聲檢測(cè)進(jìn)行。無(wú)創(chuàng)性產(chǎn)前檢測(cè)32的引進(jìn)以及高危和低危孕婦群體的增加正逐漸改變這一現(xiàn)狀,現(xiàn)已對(duì)早期染色體非整倍體的檢測(cè)產(chǎn)生影響。然而,產(chǎn)后新生兒檢查仍主要依賴表型,很少進(jìn)行身體以及智力方面的評(píng)估。微陣列技術(shù)由于普及性差、價(jià)格高昂,僅限于小部分人作為輔助手段進(jìn)行產(chǎn)前和產(chǎn)后檢測(cè)。因此,新生兒和成人染色體疾病帶來的社會(huì)和經(jīng)濟(jì)負(fù)擔(dān)居高不下27-29。本研究檢驗(yàn)了 CNV-seq在染色體疾病檢測(cè)方面的效能。結(jié)果表明,廣泛推行的新一代測(cè)序技術(shù)有望顯著降低染色體疾病在發(fā)達(dá)國(guó)家和發(fā)展中國(guó)家的發(fā)病率。首先,CNV-seq 能檢出大約 0.1 Mb CNVs 引發(fā)的已知染色體疾病,故可用于分析各類型樣本,包括羊水、絨毛、流產(chǎn)組織和外周血等;其次,測(cè)序試劑的成本將隨著時(shí)間的推移而顯著降低,加之工作流程簡(jiǎn)單,CNV-seq 有望成為比微陣列技術(shù)更具擴(kuò)展性且經(jīng)濟(jì)實(shí)惠的染色體疾病檢測(cè)替代技術(shù)。此外,借助于更深層次的測(cè)序,CNV-seq 有望得以改進(jìn),用于高分辨率的 CNV 和 SNP 分析,更全面地檢測(cè)遺傳性疾病。
補(bǔ)充資料 本文的補(bǔ)充材料見 http://dx./10.1016/j.jmoldx.2014.05.002
參考文獻(xiàn)略 |
|