文章題目:Accurate classification of BRCA1 variants with saturation genome editing 研究人員:華盛頓大學(xué)基因組科學(xué)系和霍華德休斯醫(yī)學(xué)研究所 I布羅特曼·貝蒂精密醫(yī)學(xué)研究所 發(fā)表時(shí)間:2018. 09 期刊名稱:Nature 研究亮點(diǎn) 意義未明的變異嚴(yán)重的限制了遺傳學(xué)信息知識的臨床使用,其面臨的挑戰(zhàn)在BRCA1基因上顯現(xiàn)出來了。BRCA1基因作為腫瘤抑制因子,發(fā)生在該基因上的胚系功能缺失型突變能導(dǎo)致婦女患上乳腺癌,卵巢癌。雖然許多婦女都進(jìn)行了BRCA1基因的測序,但是許多新發(fā)現(xiàn)的變異的致病風(fēng)險(xiǎn)無法評估。本文使用了飽和基因編輯(SGE)的方法,從BRCA1基因編碼關(guān)鍵功能結(jié)構(gòu)區(qū)域的13個(gè)外顯子中的所有可能的SNV中選擇了96.5%進(jìn)行了處理。近4000個(gè)SNV的功能效果呈現(xiàn)雙峰分布,這和已有的致病性評價(jià)幾乎一致。超過400個(gè)非功能性(針對細(xì)胞存活的意義而言,有害變異導(dǎo)致BRCA1基因不能發(fā)揮抑癌作用,使得細(xì)胞更易凋亡,是為非功能)錯(cuò)義突變被鑒定出來,300個(gè)SNV擾亂了基因表達(dá),作者認(rèn)為這些實(shí)驗(yàn)結(jié)果很快會對BRCA1的臨床應(yīng)用產(chǎn)生用途,也可延伸用于其他基因的類似意義未明變異問題。 研究背景 眾所周知,目前醫(yī)學(xué)上預(yù)測人類基因組上的任意遺傳突變導(dǎo)致的表型結(jié)果能力還是較差的,這個(gè)問題在遇到大量的意義未明變異時(shí)表現(xiàn)得更明顯。因此,發(fā)生在某個(gè)基因上確定意義的致病突變在臨床管理上意義巨大。比如,發(fā)生在BRCA1基因上的雜合突變顯著增加了乳腺癌早期和卵巢癌早期的患病風(fēng)險(xiǎn) ,但是這一突變明顯又是可控的,因?yàn)槎啻螖?shù)的篩查或者預(yù)防藥物治療有利于改善結(jié)果。但是至今為止的許多BRCA1基因的SNV都被定義為意義未明,所以進(jìn)一步解釋這些變異是迫切的。 常見的解決意義未明變異(VUS)的兩條主要途徑是:數(shù)據(jù)共享,這是由于許多復(fù)發(fā)變異在多個(gè)個(gè)體都有檢出,便可以借鑒檢出突變個(gè)體的癌癥發(fā)展情況來分析該變異情況,但是存在BRCA1基因大多數(shù)變異都是罕見變異和BRCA1基因的不完全外顯的情況。因?yàn)锽RCA1基因的同源DNA修復(fù)(HDR)是基因發(fā)揮腫瘤抑制功能的關(guān)鍵,所以BRCA1基因變異是否恢復(fù)它的同源DNA整合能力是一個(gè)常見的檢測標(biāo)準(zhǔn)。還有其他的檢測比如評價(jià)胚胎干細(xì)胞生存能力,轉(zhuǎn)錄激活能力,藥物敏感性,蛋白互作用等。但是功能實(shí)驗(yàn)評價(jià)BRCA1變異也存在一些限制。比如功能實(shí)驗(yàn)驗(yàn)證落后于VUS的發(fā)現(xiàn);用于表達(dá)變異的cDNA轉(zhuǎn)基因體脫離了基因組環(huán)境,不能檢測剪接效果或轉(zhuǎn)錄本穩(wěn)定性,有人工表達(dá)體過表達(dá)的風(fēng)險(xiǎn)。而借助基因編輯技術(shù),可以克服這些挑戰(zhàn)。而且目前這一技術(shù)還沒運(yùn)用于像BRCA1基因等和癌癥易感相關(guān)的基因。有鑒于此,本文對BRCA1基因關(guān)鍵的13個(gè)外顯子涉及的3893個(gè)SNV(約占96.5%)進(jìn)行了飽和基因編輯,以分析BRCA1基因的變異的功能結(jié)果并用于后續(xù)基因檢測。 研究成果 BRCA1基因的飽和基因編輯 在人類單倍體細(xì)胞系HAP1中,參與同源DNA修復(fù)(HDR)的許多基因像BRCA1,BRCA2等是非常重要的(圖1a),作者用Cas9和gRNAs靶定位這些基因做了一個(gè)質(zhì)粒共表達(dá)實(shí)驗(yàn),然后轉(zhuǎn)染HAP1細(xì)胞,驗(yàn)證了這些基因發(fā)生變異會導(dǎo)致HAP1細(xì)胞存活力下降并最終大量死亡的現(xiàn)象,確定了參與HDR途徑的基因成分在HAP1細(xì)胞中的重要性,圖1a中標(biāo)紅色的基因就是實(shí)驗(yàn)中證明在HAP1細(xì)胞系中地位重要的基因(也即HAP1必須基因),并且在圖中進(jìn)行了放大展示。接下來是構(gòu)建和優(yōu)化用于SGEs的文庫(圖1b),這是用于在細(xì)胞系中引入BRCA1基因13個(gè)外顯子的所有可能的SNVs(RING結(jié)構(gòu)區(qū),外顯子2-5,BRCT結(jié)構(gòu)區(qū),外顯子15-23)。使用芯片合成的寡核苷酸庫(囊括13個(gè)外顯子和外顯子外面內(nèi)含子10bp),寡核苷酸庫里的變異都經(jīng)由同源臂克隆到質(zhì)粒上。當(dāng)然,每一個(gè)寡核苷酸在Cas9靶位都設(shè)計(jì)了用于在HDR成功后減少重復(fù)剪切的同義甲氨基取代。一個(gè)SGEs實(shí)驗(yàn)對應(yīng)一個(gè)外顯子。共計(jì)2千萬個(gè)在HAP1細(xì)胞day0(作者自定義,開始轉(zhuǎn)染的當(dāng)天)進(jìn)行SNV文庫,Cas9/gRNA質(zhì)粒轉(zhuǎn)染,在day5和day11收集編輯過得外顯子靶向gDNA和 RNA測序用于后續(xù)量化變異頻率。為了獲得更多詳細(xì)的數(shù)據(jù)。作者用單克隆LIG4-敲除HAP1細(xì)胞系和對1n倍數(shù)HAP1細(xì)胞排序來優(yōu)化SGE流程。除此之外,作者還使用靶向RNA測序來決定大量發(fā)生在BRCA1基因mRNA的SNV。
圖1 對BRCA1基因的3893個(gè)SNV進(jìn)行功能性打分 為了計(jì)算每個(gè)SNV的功能打分,首先計(jì)算day11(day11是從相對于進(jìn)行SNV文庫,Cas9/gRNA質(zhì)粒和HAP1細(xì)胞共轉(zhuǎn)染實(shí)驗(yàn)的當(dāng)天為day0來計(jì)算的,下同)的SNV的頻率比上該SNV在質(zhì)粒文庫的頻率,然后計(jì)算log2 值;其次,使用day5的SNV頻率構(gòu)建了編輯速率的位置偏好性模型。再其次,為了不同外顯子能進(jìn)行比較,對功能打分進(jìn)行了歸一化。最后,一小部分分?jǐn)?shù)可信度較低的被過濾掉。 功能打分呈雙峰分布(圖2d),無義突變位于-1.25分以下,98.7%的同義SNV距離剪接連接處3bp以上距離的打分都在-1.25分以上,作者借助二元高斯混合模型把所有的SNV分類為功能性,非功能性,中間型,最終72.5的SNV,定義為功能性,21.1%定義為非功能性,6.4%定義為中間型。非功能性分布定義為跨越所有外顯子的無義突變,功能性分布定義為外顯子區(qū)間的同義突變,且不是位于剪接連接區(qū)域的3bp以內(nèi),RNA分值在中位數(shù)同義SNV的1個(gè)SD以內(nèi)。
圖2 然而SNVs擾亂了經(jīng)典剪接位點(diǎn)卻大多數(shù)都是非功能性(89.5%)或中間型(5.5%)。SNVs位于外顯子內(nèi)部1-3bp或內(nèi)含子3-8bp效果不一樣,其中22.9%是非功能性的,SNVs位于深度內(nèi)含子區(qū)域或5`UTR區(qū)域功能結(jié)果與非剪接區(qū)域同義SNVs類似,不大可能是非功能變異(包括:內(nèi)含子,1.8%;5`UTR,0.0%;同義,1.3%)
功能性打分準(zhǔn)確預(yù)測致病性 作者調(diào)查了功能性分值與Clinvar的一致性問題。在169個(gè)SNV中,162個(gè)被定義為非功能性,2個(gè)被定義為功能性,剩下的被定義為中間型。相反,Clinvar中22個(gè)良性SNV,20個(gè)被定義為功能性,1個(gè)被定義為非功能性,1個(gè)定義為中間型(圖3a)ROC曲線顯示在處理Clinvar注釋的致病和良性變異時(shí),特異性為98.2%,敏感性為96.7%(圖3b)。對25% (64 out of 256)VUS和49.2% (60 out of 122)解釋矛盾的SNV進(jìn)行打分(圖3c),Clinvar注釋的錯(cuò)義VUS比Clinvar里缺失的錯(cuò)義SNV更大可能打分為非功能,3140個(gè)Clinvar里缺失的SNV中498個(gè)打分為非功能。對比人群數(shù)據(jù)庫,在302個(gè)與gnomAD重疊的SNV中,更高的等位基因頻率意味著更高的功能得分(補(bǔ)充材料8a)。類似地,在39個(gè)與FLOSSIES數(shù)據(jù)庫(1萬個(gè)歲數(shù)大于70歲,無罹患乳腺癌或卵巢癌)交叉的SNV中,只有一個(gè)打分為非功能性??傊?,這都表明BRCA1 SNV有著高頻率的話更可能打分為功能性。生物軟件矩陣CADD, phyloP 和Align-GVGD的評價(jià)結(jié)果比起SGE功能打分則遜色多了(圖3d)。 圖3
BRCA1缺失性功能機(jī)制 對day5的細(xì)胞進(jìn)行BRCA1轉(zhuǎn)錄本的RNA測序,發(fā)現(xiàn)89%的非功能性錯(cuò)義SNV大體上在RNA水平?jīng)]有減少,表明它們可能是通過調(diào)節(jié)蛋白水平發(fā)揮作用(圖5a)。許多基團(tuán)對不影響RNA水平的錯(cuò)義SNV敏感,而它們都位于掩埋的疏水基團(tuán)或RING域折疊所需的鋅配位環(huán)(圖5b,c)。作者也對許多影響表達(dá)的SNV采用SGE進(jìn)行了研究,所有的SNV擾亂翻譯起始密碼子的都是非功能的,一些位于-3,+4,+5位置的SNV預(yù)測出減少了翻譯起始效率則也打分為中間型或非功能性。此外,11%的非功能錯(cuò)義突變導(dǎo)致了RNA水平至少75%的減少,許多都位于非結(jié)構(gòu)區(qū)域(圖5b,5c)。表明缺失性功能導(dǎo)致的是減少mRNA水平而不是擾亂蛋白水平。 圖4 圖5 導(dǎo)致RNA缺失的變異可能影響RNA編輯。因?yàn)榭拷艚游稽c(diǎn)處的非功能外顯子SNV明顯比例過高,包括外顯子末端G核苷酸的SNV打分較低(圖4)。mRNA水平較低的非功能性外顯子SNV創(chuàng)造了了新的受體或供體位點(diǎn)(圖5d),也存在一個(gè)人6-8bp區(qū)域里面的許多SNV對mRNA水平有較大的影響,暗示了這可能是外顯子剪接增強(qiáng)子。有些外顯子傾向產(chǎn)生較低RNA打分的非功能性SNV,比如外顯子16里面的46/244個(gè)SNV(排除無義突變)都是非功能性的。大多數(shù)的都是減少了2倍以上的RNA水平,15個(gè)減少了4倍以上。相反,19外顯子中,55/234個(gè)SNV排除無義突變)也是非功能性的,但是沒有一個(gè)降低了2倍以上的表達(dá),而且外顯子19的側(cè)翼內(nèi)含子區(qū)域完全沒有非功能性SNV,暗示它可能可以粗糙的剪接。 文章總結(jié) SGE方法對于確定SNV的致病性有很高的特異性和敏感性,而且較之生物軟件矩陣預(yù)測有著更高的準(zhǔn)確性,比ClinVar判定結(jié)果精確度要高,有利于處理證據(jù)沖突的變異。同時(shí)也能為non-Clinvar變異,人群數(shù)據(jù)庫缺失的變異,和缺少遺傳學(xué)證據(jù)的變異進(jìn)行解釋。未來可以用SGE研究,PALB2, BARD1等與人體易患腫瘤相關(guān)的基因,在一定范圍縮小SGE范圍也便于理解基因組編碼的生物功能多樣性。最后,作者希望功能打分能為數(shù)以百計(jì)的BRCA1模糊的變異以及新發(fā)現(xiàn)的變異提供有用的解釋。本文也許可以作為對有潛在意義的SNV在臨床上的應(yīng)用需要的綜合功能分析的藍(lán)圖。 小編評論 因?yàn)楸狙芯渴褂玫腍AP1細(xì)胞系進(jìn)行的研究,以后如果更合適的情況下可以把基因編輯的產(chǎn)物轉(zhuǎn)移入哺乳動物體內(nèi)研究,這樣的研究結(jié)果更可靠(當(dāng)然對于大批量的基因編輯實(shí)驗(yàn)不太合適)。文章主要是使用Clinvar數(shù)據(jù)庫,人群數(shù)據(jù)庫,生物軟件預(yù)測進(jìn)行了對比,建議可以再加上人工二次校對后的HGMD數(shù)據(jù)庫。而且文章的研究對象主要局限于SNV,加上indel,CNV等也是很有前景的研究方向。另外就是希望SGE技術(shù)可以盡快使用到包括遺傳性腫瘤等孟德爾病等領(lǐng)域,造福臨床治療。當(dāng)然,或許對于體細(xì)胞變異危害性的研究也有一定借鑒意義。 參考文獻(xiàn): [1] Lea M. Starita, Jay Shendure et al. Accurate classification of BRCA1 variants with saturation genome editing. Nature, 2018,562: 217–222. |
|