摘要
全基因組關(guān)聯(lián)研究(GWAS)確定了數(shù)千種與復(fù)雜性狀相關(guān)的變異,但它們的生物學(xué)解釋通常仍不清楚。這些變體中的大多數(shù)與表達(dá)QTL(eQTL)重疊,表明它們可能參與基因表達(dá)的調(diào)節(jié)。基于此種情況提出了一種先進(jìn)的基于匯總統(tǒng)計(jì)的孟德?tīng)栯S機(jī)化方法,它同時(shí)使用多個(gè)SNP作為儀器和多種基因表達(dá)特征作為暴露。當(dāng)應(yīng)用于43種人類(lèi)表型時(shí),它揭示了2,277個(gè)推定基因,其血液表達(dá)與至少一種表型因果關(guān)聯(lián),導(dǎo)致5,009種基因 - 性狀關(guān)聯(lián); 值得注意的是,在之前的GWAS分析中,55%的人在附近沒(méi)有全基因組顯著的SNP。 使用獨(dú)立關(guān)聯(lián)匯總統(tǒng)計(jì)(UKBiobank),由于電力問(wèn)題,大多數(shù)這些位點(diǎn)被傳統(tǒng)GWAS遺漏。 這些新穎的聯(lián)系中值得注意的是高度和智力相關(guān)的PEX19和CDC42,分別已知攜帶突變導(dǎo)致身材矮小和Takenouchi-Kosaki綜合征。這個(gè)方法同樣揭示了暗示機(jī)械連接的新穎的多效因果效應(yīng),例如: TSPAN14在類(lèi)風(fēng)濕性關(guān)節(jié)炎,克羅恩病和炎癥性腸病中的共同遺傳效應(yīng)。 最后,可以證明因果基因可以是高度組織特異性的。先進(jìn)的孟德?tīng)栯S機(jī)化通過(guò)檢測(cè)關(guān)聯(lián)的更高功率來(lái)解鎖已發(fā)表的GWAS的隱藏價(jià)值。 它更好地解釋了多效性,揭示了復(fù)雜和臨床特征背后的新生物機(jī)制。 基本信息 Title:Mendelian Randomization integrating GWAS and eQTL data reveals genetic determinants of complex and clinical traits 期刊: BioRxiv 發(fā)表日期:2018.7.25 全基因組關(guān)聯(lián)研究(GWAS)已經(jīng)確定了數(shù)以萬(wàn)計(jì)與數(shù)百種復(fù)雜性狀相關(guān)的常見(jiàn)遺傳變異。 然而,使用GWAS結(jié)果鑒定因果基因是困難的,因?yàn)檫@種方法僅突出了連鎖不平衡(LD)中相關(guān)變異的精細(xì)定位區(qū)間與因果標(biāo)記。 如果沒(méi)有額外的數(shù)據(jù),將這些與基因功能的影響聯(lián)系起來(lái)并不簡(jiǎn)單,特別是因?yàn)榇蠖鄶?shù)這些性狀相關(guān)變異屬于基因組的非編碼區(qū),對(duì)蛋白質(zhì)結(jié)構(gòu)或功能沒(méi)有直接影響。 最近,已經(jīng)表明,與性狀相關(guān)的SNP與基因表達(dá)相關(guān)的可能性是三倍,即表達(dá)數(shù)量性狀基因座(eQTL),因此,了解SNP特性關(guān)聯(lián)背后的生物學(xué)機(jī)制需要專(zhuān)注于研究它們?cè)诨虮磉_(dá)調(diào)控中的潛在作用。 基于此種情況提出整合GWAS和eQTL數(shù)據(jù)的轉(zhuǎn)錄組范圍關(guān)聯(lián)研究(TWAS)來(lái)揭示基因 - 性狀關(guān)聯(lián)。然而,雖然這些研究旨在鑒定其(遺傳決定的)表達(dá)與復(fù)雜性狀顯著相關(guān)的基因,但它們并不旨在估計(jì)因果效應(yīng)的強(qiáng)度,也無(wú)法區(qū)分因果關(guān)系與多效性(即當(dāng)遺傳變異影響多個(gè)時(shí))表型)。 以此,作者整合了來(lái)自GWAS的總結(jié)水平數(shù)據(jù)和孟德?tīng)栯S機(jī)化(MR)框架中的eQTL研究,以估計(jì)基因表達(dá)對(duì)幾種人類(lèi)表型的這種因果效應(yīng)。由于性狀相關(guān)變異通常是多基因的eQTL,所以采用了一種多儀器,多次暴露MR方法,估計(jì)基因表達(dá)水平對(duì)結(jié)果性狀的聯(lián)合因果效應(yīng)。此方法僅需要匯總級(jí)數(shù)據(jù)允許來(lái)自不同研究的數(shù)據(jù)整合。 作者將他們的方法應(yīng)用于最大的公開(kāi)GWAS匯總統(tǒng)計(jì)數(shù)據(jù)(基于樣本大小從20,883到339,224個(gè)人)并將它們與來(lái)自GTEx(基因組織表達(dá)項(xiàng)目)和eQTLGen聯(lián)盟(n = 14,115, 未發(fā)表)為43種復(fù)雜的人類(lèi)特征提供推定的功能相關(guān)基因的圖譜。 孟德?tīng)栯S機(jī)化依賴(lài)于關(guān)于這些工具的三個(gè)假設(shè):(i)它們必須與暴露有足夠的聯(lián)系; (ii)他們不應(yīng)與暴露 - 結(jié)果關(guān)系的任何混淆因素聯(lián)系在一起; (iii)只有通過(guò)暴露才能將結(jié)果與結(jié)果聯(lián)系起來(lái)。 通常通過(guò)多效性違反任何這些假設(shè)會(huì)導(dǎo)致對(duì)因果效應(yīng)和潛在誤報(bào)的偏倚估計(jì)。 第二個(gè)假設(shè)是最難以驗(yàn)證的,因?yàn)榛煜蛩赝ǔJ俏粗模詈蟮募僭O(shè)只能在相同(大)樣本中獲得SNP,暴露和結(jié)果數(shù)據(jù)時(shí)才能得到最佳部分驗(yàn)證,這兩個(gè)條件不能滿(mǎn)足兩個(gè) -sample MR。 最近,Zhu等應(yīng)用基于數(shù)據(jù)的總結(jié)MR(SMR)方法來(lái)測(cè)試遺傳變異對(duì)表型的影響是否由基因表達(dá)介導(dǎo)。 由于基于單一遺傳變異的原始方法特別容易受到多效性的影響,因此將其擴(kuò)展為更一般的形式(GSMR:廣義SMR),其使用多個(gè)獨(dú)立的SNP作為工具變量進(jìn)行MR分析。 他們?cè)O(shè)計(jì)了異質(zhì)性檢驗(yàn)(HEIDI)來(lái)識(shí)別多效性SNP,這可能會(huì)使因果估計(jì)產(chǎn)生偏差。 我們注意到許多多效性效應(yīng)僅通過(guò)鄰近基因的表達(dá)水平介導(dǎo),因?yàn)楸┞稇?yīng)該減少M(fèi)R假設(shè)違規(guī),同時(shí)提高能量。 此外,這樣的應(yīng)用可能能夠更好地區(qū)分基因與相關(guān)表達(dá)水平的因果效應(yīng)。出于這個(gè)原因,作者提出了一種多基因方法(圖1a),它應(yīng)該特別減少由于多效性引起的偏差 對(duì)于一組k基因,使用逆方差加權(quán)方法進(jìn)行匯總統(tǒng)計(jì),我們估計(jì)了一個(gè)基因座上幾個(gè)基因的表達(dá)水平對(duì)結(jié)果特征的多變量因果效應(yīng)
其中E是一個(gè)n×k矩陣,其中包含n個(gè)SNP對(duì)k基因表達(dá)的單變量效應(yīng)大小(這些估計(jì)值來(lái)自eQTL研究); G是長(zhǎng)度為n的載體,其包含表型上相同n個(gè)SNP的單變量效應(yīng)大?。ㄟ@些估計(jì)值來(lái)自公開(kāi)可用的GWAS匯總統(tǒng)計(jì)量),C是n個(gè)SNP之間的成對(duì)相關(guān)(LD)矩陣(來(lái)自UK10K估計(jì)) 面板)。 作者將多儀器,多次暴露MR方法應(yīng)用于來(lái)自> 14K個(gè)體(eQTLGen Consortium,未發(fā)表數(shù)據(jù))的血液樣本中的eQTL薈萃分析的總結(jié)數(shù)據(jù)和最大的公開(kāi)可用GWAS數(shù)據(jù),以評(píng)估基因表達(dá)之間的因果關(guān)聯(lián) 和43個(gè)復(fù)雜的特征。 來(lái)自eQTLGen Consortium的數(shù)據(jù)包含9,136,405個(gè)SNP和20,468個(gè)基因的關(guān)聯(lián)匯總統(tǒng)計(jì)數(shù)據(jù)。 在作者他們的分析中,僅包括PeQTL <1x10-03的順式-eqtl,產(chǎn)生針對(duì)18,732個(gè)egenes的3,520,820個(gè)eqtl(即其表達(dá)水平與至少一個(gè)遺傳變體相關(guān)的基因)。>1x10-03的順式-eqtl,產(chǎn)生針對(duì)18,732個(gè)egenes的3,520,820個(gè)eqtl(即其表達(dá)水平與至少一個(gè)遺傳變體相關(guān)的基因)。>他們只使用順式-eQTL數(shù)據(jù),因?yàn)閠rans-eQTL通常具有較弱的效應(yīng)大小和較小的直接效應(yīng),因此更容易違反MR假設(shè)。 總共,作者他們發(fā)現(xiàn)2,277個(gè)基因與至少一種表型推定因果關(guān)聯(lián),產(chǎn)生5,009個(gè)基因 - 性狀關(guān)聯(lián)(PMR <5x10-07 =="" 0.05="" 2306="" *="" 43),其中2,306和43對(duì)應(yīng)于有效基因的數(shù)量。="">5x10-07>作者他們的研究中,基因組的表達(dá)水平和分析的性狀數(shù)量分別為(補(bǔ)充圖1和補(bǔ)充表1和2)。 作者他們展示了單基因分析如何導(dǎo)致有偏見(jiàn)的因果效應(yīng)估計(jì)(補(bǔ)充圖2)。 遺傳變異仍然可以通過(guò)其他(非表達(dá)相關(guān)的)風(fēng)險(xiǎn)因素影響結(jié)果。 因此,作者他們應(yīng)用異質(zhì)性檢驗(yàn)(參見(jiàn)方法)來(lái)檢測(cè)多效性SNP,即遺傳變異,其對(duì)結(jié)果的影響與使用它們對(duì)暴露的影響和暴露對(duì)結(jié)果的估計(jì)因果效應(yīng)估計(jì)的預(yù)期效果顯著不同。 總體而言,作者他們檢測(cè)到6,137個(gè)最初顯著的基因 - 性狀關(guān)聯(lián)中的2,072個(gè)的異質(zhì)性(PHET <1x10-04)。 在這2,072個(gè)關(guān)聯(lián)中,822在去除顯示多效性的snp后通過(guò)了異質(zhì)性測(cè)試。="">1x10-04)。>致確定了122個(gè)額外的關(guān)聯(lián),給出了最終的5,009個(gè)強(qiáng)健關(guān)聯(lián)。 ?圖1a。 多儀器,多次暴露MR的示意圖,使用多個(gè)儀器變量(SNP)估計(jì)多次暴露(基因表達(dá))對(duì)表型的因果影響。 b。驗(yàn)證MR發(fā)現(xiàn)的基因。 條形圖表示在UKBB的不同大小子集中進(jìn)行MR分析時(shí)發(fā)現(xiàn)的BMI因果的基因數(shù)。 其中,GWAS在同一樣本中確認(rèn)的那些(即在GW顯著SNP的500kb內(nèi)),用深藍(lán)色標(biāo)記; 只有在全部380K UKBB樣品中以淺藍(lán)色運(yùn)行GWAS時(shí)才能確認(rèn); 確認(rèn)僅在完整的UKBB數(shù)據(jù)集中以灰色運(yùn)行MR; 而頂部的淺灰色條代表MR發(fā)現(xiàn)的基因數(shù)量,但未在完整的UKBB數(shù)據(jù)集中得到證實(shí)。 作者的方法將eQTL信息納入GWAS分析,有可能增加GWAS識(shí)別與復(fù)雜性狀相關(guān)的基因座的能力。傳統(tǒng)的基于基因的測(cè)試,通常基于物理距離或LD很少導(dǎo)致新發(fā)現(xiàn)的基因座。 利用這些方法,鑒定GWAS遺漏的新基因座是非常困難的,因?yàn)榛蛑?附近的一組有限的(獨(dú)立的)相關(guān)變體被大量無(wú)效SNP稀釋。 因此,基因的組合關(guān)聯(lián)信號(hào)通常弱于該區(qū)域中最強(qiáng)的SNP。此外,鑒于GWAS SNP落在編碼區(qū)之外,它們可以從基因中心分析中排除。 作者對(duì)來(lái)自UKBiobank(UKBB)的幾個(gè)個(gè)體子集進(jìn)行了BMI的GWAS和MR分析。使用完整樣本,以用來(lái)評(píng)估他們的方法的表現(xiàn)。作者他們發(fā)現(xiàn)343個(gè)與BMI相關(guān)的重要MR基因(圖1b)。其中,108個(gè)距離任何GW顯著SNP超過(guò)500kb,因此可能代表由于功率問(wèn)題而被傳統(tǒng)GWAS遺漏的新基因座。為了評(píng)估其他基因是否暗示具有真正相關(guān)SNP的區(qū)域,作者他們對(duì)18個(gè)UKBB亞群進(jìn)行了MR和GWAS分析,樣本量增加(從20,000到360,000)。作者他們觀(guān)察到,在小子集中大多數(shù)MR鑒定的基因被確認(rèn),即落在使用全樣本在GWAS中作為GW顯著饋送的前導(dǎo)SNP識(shí)別的500kb附近。例如,在100K個(gè)體的子集中,通過(guò)MR發(fā)現(xiàn)并且未被GWAS發(fā)現(xiàn)的68個(gè)基因(即,遠(yuǎn)離任何GW顯著SNP定位> 500kb)與354個(gè)基因作圖顯著重疊(OR = 20,P = 9.65x10-26)使用完整數(shù)據(jù)集執(zhí)行的GWAS識(shí)別的SNP的500kb內(nèi)。作者他們觀(guān)察到GWAS遺漏的基因座部分隨著樣本量的增加而減少,表明飽和效應(yīng)。為了支持作者他們的研究結(jié)果的一致性,在完整樣本的18個(gè)子集中的任何一個(gè)中發(fā)現(xiàn)并且在完整數(shù)據(jù)集中被GWAS遺漏的> 74%的MR基因顯示在完整數(shù)據(jù)集中進(jìn)行的MR分析中的顯著關(guān)聯(lián)。 總共作者他們發(fā)現(xiàn)2,277個(gè)與至少一種表型有因果關(guān)系的推定基因(PMR <5x10-07時(shí)5,009種基因 -="" 性狀關(guān)聯(lián))(補(bǔ)充圖1,補(bǔ)充表1和2)。在這些基因="" -="" 性狀關(guān)聯(lián)中,超過(guò)一半(2,736)已被先前的gwas遺漏,因?yàn)闆](méi)有snp達(dá)到基因組內(nèi)基因組顯著性水平+/-="">5x10-07時(shí)5,009種基因>括其智力癥狀失能。此外,在常規(guī)GWAS遺漏的其他區(qū)域中,我們顯示ALS2(PMR = 1.58x10-07)(圖2b)和ZNF565(PMR = 2.65x10-07)與肌萎縮側(cè)索硬化和精神分裂癥[圖25]分別不限于稀有編碼變體。 為了測(cè)試推定的因果基因是否與功能相關(guān),作者他們將與高度顯著相關(guān)的基因與參與異常骨骼生長(zhǎng)綜合征的基因列表重疊。作者他們觀(guān)察到富集的趨勢(shì)為1.3倍(P> 0.05),表明我們的優(yōu)先基因具有額外的支持證據(jù)。 例如,在VANGL2基因座內(nèi),其中包含由Wood等鑒定的與身高相關(guān)的SNP [topSNP:rs6688100 P = 2.30x10-08],作者他們的結(jié)果表明VANGL2不是因果關(guān)系(PMR = 0.72)(圖2)。 2c)并顯示NCSTN(PMR = 2.30x10-18),COPA(PMR = 4.48x10-11)和PEX19(PMR = 8.02x10-11)的高表達(dá)與高身高因果關(guān)聯(lián)。 雖然尚不清楚三個(gè)重要的MR基因中哪一個(gè)在該區(qū)域中功能最相關(guān),但已知PEX19突變與身材矮小有關(guān)(Zellweger綜合征,OMIM:#614886),使其成為最強(qiáng)的候選者。 作者他們還發(fā)現(xiàn)了2,626個(gè)區(qū)域,其中MR僅鑒定了一個(gè)推定的因果基因。 在一個(gè)高度區(qū)域,作者他們的分析專(zhuān)門(mén)指出DYM(PMR = 3.42x10-44),其高表達(dá)與高身高有關(guān)。 已知DYM與Smith-McCort發(fā)育不良(OMIM:#607326)有關(guān),特別是身材矮小。 在另一個(gè)實(shí)例中,對(duì)于類(lèi)風(fēng)濕性關(guān)節(jié)炎,CTLA4作為其基因座上唯一的致病基因出現(xiàn):其低表達(dá)與一般人群中類(lèi)風(fēng)濕性關(guān)節(jié)炎的風(fēng)險(xiǎn)顯著相關(guān)(PMR = 3.04×10-22)。 CTLA4與自身免疫性淋巴增生綜合征(OMIM:#616100)相關(guān),在其癥狀中呈現(xiàn)自身免疫性關(guān)節(jié)炎。 假設(shè)編碼變異可能是給定基因座中的因果變異,我們測(cè)試了70個(gè)基因,這些基因在我們的MR結(jié)果中含有至少一個(gè)與高度相關(guān)的編碼變體,用于因果關(guān)聯(lián)。 44個(gè)可測(cè)試基因中只有4個(gè)對(duì)高度有顯著影響,這表明當(dāng)這種關(guān)聯(lián)是由編碼變異驅(qū)動(dòng)而不是基因表達(dá)時(shí),我們的MR方法正確地指出了任何因果基因。 ?圖2 GWAS和MR分析的區(qū)域關(guān)聯(lián)圖。 上圖顯示單SNP關(guān)聯(lián)強(qiáng)度(y軸顯示-log10(p值))與基因組位置(在hg19 / GRCh37基因組構(gòu)建; x軸上)相對(duì)于最顯著的SNP,用紫色點(diǎn)表示。 下圖顯示了基因因果關(guān)聯(lián)強(qiáng)度(y軸顯示-log10(p值))與基因組位置。 以灰色突出顯示的基因未進(jìn)行測(cè)試(即:它們未通過(guò)異質(zhì)性測(cè)試或未具有顯著的eQTL)。 綠色虛線(xiàn)表示GWAS和MR顯著性閾值。 注意,對(duì)于智力和肌萎縮側(cè)索硬化,最顯著的SNP沒(méi)有達(dá)到GW顯著性(上圖),而MR指出推定的因果基因(下圖)。 最近的研究表明,最接近GWAS熱門(mén)命中的基因通常不是因果關(guān)系。 與這些發(fā)現(xiàn)一致,在具有至少一個(gè)全基因組顯著SNP的1,423個(gè)MR重要區(qū)域中,作者他們發(fā)現(xiàn)最接近該區(qū)域中頂部SNP的63%的基因與該表型沒(méi)有顯示任何顯著關(guān)聯(lián)(補(bǔ)充圖。4)。 許多這樣的例子之一是教育成就與ERCC8(PMR = 4.82x10-07)之間的重要因果關(guān)聯(lián),ERCC8是一個(gè)基因,與ELOVL7地區(qū)的單基因Cockayne綜合征A(OMIM#216400)有關(guān)[topSNP: rs61160187,P = 5.93x10-13) 作者他們研究了多效性的程度并鑒定了與多種表型相關(guān)的1,870個(gè)基因(補(bǔ)充圖1)。其中,XKR6和BLK被證明是最多效的,顯示與> 20種表型的因果關(guān)聯(lián),包括自身免疫疾病,神經(jīng),代謝,造血和人體測(cè)量性狀。與此結(jié)果一致,它們?cè)谠S多GWAS中被“識(shí)別”。其中一種多效基因是TSPAN14,與克羅恩?。–D)(PMR = 6.93x10-09),炎癥性腸?。↖BD)(PMR = 2.78x10-07),類(lèi)風(fēng)濕性關(guān)節(jié)炎(RA)有顯著相關(guān)性(PMR = 8.92) x10-10),單核細(xì)胞(PMR = 2.04x10-08)和網(wǎng)織紅細(xì)胞(PMR = 2.80x10-09)。該結(jié)果確定了CD,IBD和RA之間的共享效應(yīng)(圖3)。值得注意的是,作者他們觀(guān)察到了顯著的因果關(guān)聯(lián),盡管作者他們?cè)谌N疾病的MR分析中使用的GWAS遺漏了這一位點(diǎn)(CD:N = 5,956例/ 14,927對(duì)照; IBD:N = 12,882 / 21,770 ; RA:N = 14,361 / 43,423)。支持作者他們的研究結(jié)果后,該基因座后來(lái)得到了更大的薈萃分析證實(shí),該分析將GWAS數(shù)據(jù)與ImmunoChip數(shù)據(jù)相結(jié)合(CD:N = 20,550 / 41,642; IBD:N = 38,155 / 48,485),導(dǎo)致GW顯著關(guān)聯(lián)CD和IBD(補(bǔ)充圖5)。 作者他們還發(fā)現(xiàn)19個(gè)基因顯示出對(duì)月經(jīng)初潮的BMI和年齡有顯著的因果影響,證實(shí)了這些特征的共同遺傳基礎(chǔ)。 這些基因中的16個(gè)與這些性狀之間的負(fù)遺傳和表型相關(guān)性具有相反的效果。 在這16個(gè)基因中,兩個(gè)(CADM1和ZC3H4)也被先前的GWAS檢測(cè)到兩種性狀,而7個(gè)(BNIPL,C17orf89,GGT7,MAPK3,PM20D1,PPM1F和PPP4C)和5個(gè)(APOBR,C1QTNF4, 已知GTF3A,NUP88和SULT1A1)分別與月經(jīng)初潮年齡或BMI完全相關(guān)。有趣的是,作者他們確定了兩個(gè)基因(DCAF12和DNAJA4)作為新推定的因果關(guān)系。 ?圖3與克羅恩病,炎癥性腸病和類(lèi)風(fēng)濕性關(guān)節(jié)炎相關(guān)的TSPAN14基因座的GWAS和MR分析的區(qū)域關(guān)聯(lián)圖。 上圖顯示單SNP關(guān)聯(lián)強(qiáng)度(y軸顯示-log10(p值))與最顯著SNP周?chē)幕蚪M位置(在hg19 / GRCh37基因組構(gòu)建; x軸上),用紫色點(diǎn)表示。 下圖顯示了基因因果關(guān)聯(lián)強(qiáng)度(y軸顯示-log10(p值))與基因組位置。 以灰色突出顯示的基因未進(jìn)行測(cè)試(即:它們未通過(guò)異質(zhì)性測(cè)試或未具有顯著的eQTL)。 綠色虛線(xiàn)表示GWAS和MR顯著性閾值。 為了評(píng)估基因表達(dá)對(duì)每對(duì)性狀的共同因果效應(yīng),作者他們計(jì)算了2,203個(gè)獨(dú)立基因子集中基因表達(dá)的因果效應(yīng)估計(jì)值(或等效于MR分析的Z值)之間的相關(guān)性(ρE) (包括對(duì)任何特征無(wú)重要意義的那些;見(jiàn)方法)。在903對(duì)特征中,作者他們發(fā)現(xiàn)了幾個(gè)顯著的相關(guān)性,與先前的流行病學(xué)觀(guān)察結(jié)果一致(圖4a)。例如,對(duì)于初潮年齡,分別觀(guān)察到負(fù)(ρE= - 0.17 PFDR = 2.25x10-15)和正相關(guān)(ρE= 0.11,PFDR = 1.04x10-06)與BMI和身高。正如預(yù)期的那樣,冠狀動(dòng)脈疾病與教育程度之間呈負(fù)相關(guān)(ρE= - 0.10,PFDR = 1.26x10-05)。在分析中包括的43個(gè)特征中,17個(gè)被包括在之前的研究中,該研究報(bào)告了通過(guò)LD分?jǐn)?shù)回歸(ρG)估計(jì)的性狀之間的遺傳相關(guān)性。比較表達(dá)式 - (ρE)與遺傳相關(guān)(ρG)估計(jì)的136對(duì)常見(jiàn)性狀,發(fā)現(xiàn)了兩個(gè)估計(jì)之間有顯著的一致性(r = 0.84)。值得注意的是,表達(dá)相關(guān)性似乎平均為遺傳相關(guān)性的44%。雖然具有較小方差的遺傳相關(guān)性估計(jì)可以解釋這種衰減的一部分,但作者認(rèn)為主要原因是大約一半的觀(guān)察到的遺傳相關(guān)性在全血中傳播到基因表達(dá)水平(圖4b)。特別是觀(guān)察到30對(duì)特征顯示ρE的顯著性和ρG,而七只對(duì)ρE有效,12只對(duì)ρG 87對(duì)任何一個(gè)都沒(méi)有意義。在未通過(guò)LD評(píng)分回歸確定的顯著相關(guān)性中,發(fā)現(xiàn)精神分裂癥與潰瘍性結(jié)腸炎之間存在正相關(guān)(ρE= 0.07,PFDR = 4.45x10-03),與先前研究中報(bào)道的遺傳相關(guān)性方向一致并支持分子一小部分精神分裂癥病例的自身免疫病因證據(jù)。作者他們還觀(guān)察到冠狀動(dòng)脈疾病與克羅恩病之間呈正相關(guān)(ρE= 0.08,PFDR = 8.09x10-04),證實(shí)了最近一項(xiàng)研究的結(jié)果。 ?圖4a。 來(lái)自43個(gè)性狀的MR結(jié)果的表達(dá)相關(guān)性。 對(duì)于2,203個(gè)獨(dú)立基因和每對(duì)性狀,計(jì)算了Z分?jǐn)?shù)(與標(biāo)準(zhǔn)化因果效應(yīng)成比例)之間的Pearson相關(guān)性(ρE)。 較暗的顏色表示較高的相關(guān)性,藍(lán)色和紅色分別對(duì)應(yīng)于正和負(fù)關(guān)聯(lián)。灣 表達(dá)相關(guān)性(ρE)與從LD得分回歸得到的遺傳相關(guān)性(ρG)之間的線(xiàn)性關(guān)系。 作者選擇了他們的研究和Bulik-Sullivan等分析的特征,并且對(duì)于每對(duì)特征,比較了兩個(gè)相關(guān)性。 灰色點(diǎn)表示非顯著性狀對(duì),藍(lán)色點(diǎn)表示對(duì)于兩個(gè)相關(guān)性都顯著的性狀對(duì),而紅色和綠色對(duì)應(yīng)于僅在(ρG)或ρE中顯著的性狀。 虛線(xiàn)表示回歸線(xiàn)。 作者他們使用由GTEx(基因組織表達(dá)項(xiàng)目)鑒定的eQTL進(jìn)行組織特異性MR分析,其提供了對(duì)48種人組織的基因表達(dá)的遺傳效應(yīng)的統(tǒng)一視圖。 盡管跨組織共享eQTL(在一致的效應(yīng)方向上)非常常見(jiàn),但有許多組織特異性eQTLs。 出于實(shí)際原因,作者他們僅針對(duì)關(guān)鍵組織眾所周知的四種表型進(jìn)行組織特異性分析:CAD(動(dòng)脈),CD(腸),LDL(肝臟)和T2D(胰腺)。 在作者他們的結(jié)果(補(bǔ)充表3-6)中,發(fā)現(xiàn)MRAS和PHACTR1與冠狀動(dòng)脈疾?。–AD)相關(guān),在動(dòng)脈組織中顯示出顯著的相關(guān)性,這對(duì)該特征的遺傳因果關(guān)系貢獻(xiàn)最大(MRAS:PMR = 4.89x10-09在動(dòng)脈冠狀動(dòng)脈中,PMR = 5.28x10-09在動(dòng)脈脛骨,PHACTR1:PMR = 4.66x10-38在動(dòng)脈冠狀動(dòng)脈,PMR = 1.02x10-36在動(dòng)脈主動(dòng)脈和PMR = 3.39x10-30在動(dòng)脈脛骨) (圖5)。 有趣的是,使用來(lái)自eQTLGen Consortium的大型數(shù)據(jù)集,沒(méi)有基因在其他組織中顯示出顯著的因果效應(yīng),包括全血。 MRAS和PHACTR1在其他組織中具有顯著的eQTL,但這些效應(yīng)中沒(méi)有一個(gè)與疾病相關(guān),證實(shí)疾病相關(guān)的eQTL是組織特異性的。 作者還確認(rèn)SORT1是LDL的原因,與之前的研究結(jié)果一致。 不是LDL原因的組織,如皮膚,垂體和睪丸,錯(cuò)誤地指出PSRC1是最可能推定的因果基因,只有肝臟指出SORT1是強(qiáng)候選基因(補(bǔ)充圖6和補(bǔ)充表5)。 該結(jié)果再次證實(shí)了在尋找因果基因之前鑒定所研究的表型的相關(guān)組織的重要性。 ?圖5 MRAS和PHACTR1對(duì)冠狀動(dòng)脈疾病的組織特異性影響。A-B。 最佳。 關(guān)聯(lián)圖顯示MRAS(a)和PHACTR1(b)基因區(qū)域中冠狀動(dòng)脈疾病的全基因組顯著基因座。 表示單SNP關(guān)聯(lián)強(qiáng)度(y軸顯示-log10 p值)與最顯著SNP周?chē)幕蚪M位置(在hg19 / GRCh37基因組構(gòu)建; x軸上),用紫色點(diǎn)表示。 該區(qū)域中的其他SNP被顏色編碼以反映其具有最高SNP的LD(根據(jù)來(lái)自1000個(gè)基因組項(xiàng)目階段3單倍型的成對(duì)r2值)。 底部。 基因和外顯子的位置以及各自的轉(zhuǎn)錄鏈。 光盤(pán)。 組織特異性的因果效應(yīng)。 y軸上列出的基因; 在x軸上列出的組織。 較暗的點(diǎn)對(duì)應(yīng)于更強(qiáng)的關(guān)聯(lián)。 以灰色突出顯示的基因未經(jīng)過(guò)測(cè)試。 MRAS和PHACTR1僅在動(dòng)脈組織中顯示出顯著的相關(guān)性。 作者他們提出的方法能夠?qū)σ阎蛐路f相關(guān)區(qū)域中的基因進(jìn)行優(yōu)先級(jí)排序以及鑒定常規(guī)GWAS遺漏的基因座。利用UKBB數(shù)據(jù)發(fā)現(xiàn),在大多數(shù)情況下,這些新基因座都有真實(shí)的信號(hào),最終將由更大的GWAS發(fā)現(xiàn)。 像所有方法一樣,這個(gè)方法也有其局限性,在解釋結(jié)果時(shí)需要考慮這些局限性。本研究報(bào)告的假定因果關(guān)聯(lián)不是確定的。它們?yōu)槲磥?lái)的后續(xù)研究提供了候選基因的優(yōu)先列表,并闡明了復(fù)雜性狀的可能生物學(xué)機(jī)制。通過(guò)這個(gè)的方法,我們可以評(píng)估哪些與性狀相關(guān)的SNP可能通過(guò)基因表達(dá)發(fā)揮作用。 此方法的另一個(gè)缺點(diǎn)是使用當(dāng)前的eQTL數(shù)據(jù)只有15K的egenes是可測(cè)試的,這大大降低了檢測(cè)相關(guān)途徑和調(diào)控網(wǎng)絡(luò)中優(yōu)先基因集富集的能力。許多基因不是通過(guò)改變基因表達(dá)導(dǎo)致疾病,而是通過(guò)修飾RNA或蛋白質(zhì)序列,所以這個(gè)方法有一定的盲目性。 這個(gè)研究的進(jìn)一步局限是違反MR假設(shè)。 特別是水平多效性和儀器的間接影響 暴露可以大大偏向因果效應(yīng)估計(jì)。事實(shí)上,隨著GWAS研究規(guī)模的增加,由于有輕微多效性的證據(jù),將排除更多的SNP,從而降低MR功率。 這個(gè)方法僅需要來(lái)自GWAS的匯總統(tǒng)計(jì)數(shù)據(jù)以及與LD估計(jì)值相關(guān)的任何類(lèi)型的暴露,再次證明了對(duì)現(xiàn)有數(shù)據(jù)的精心組合分析的能力,以闡明復(fù)雜特征的生物機(jī)制并幫助設(shè)計(jì)功能實(shí)驗(yàn)。 糖炒栗子 撰文 本文為博淼生物原創(chuàng) |
|
來(lái)自: 生物_醫(yī)藥_科研 > 《文獻(xiàn)案例》