來源:生物谷原創(chuàng) 2022-04-04 16:14 2022年4月4日訊/生物谷BIOON/---較大的、高同一性的重復(fù)序列---被稱為片段重復(fù)(segmental duplication, SD)---通常是基因組中最后被測序和組裝的區(qū)域。雖然人類參 2022年4月4日訊/生物谷BIOON/---較大的、高同一性的重復(fù)序列---被稱為片段重復(fù)(segmental duplication, SD)---通常是基因組中最后被測序和組裝的區(qū)域。雖然人類參考基因組為構(gòu)建SD景觀提供了路線圖,但是這種基因組中剩余的50%以上的空白對應(yīng)于復(fù)雜的SD區(qū)域。 SD是進化基因創(chuàng)新的主要來源,對類人猿物種內(nèi)部和之間的遺傳變異起著不成比例的作用。有了完整的人類基因組:T2T-CHM13,科學家們就有可能識別基因并發(fā)現(xiàn)人類的遺傳變異模式。 在一項新的研究中,來自端粒到端粒(Telomere-to-Telomere, T2T)聯(lián)盟的研究人員在T2T-CHM13中發(fā)現(xiàn)了51 Mbp(million base pair,百萬個堿基對)的額外人類SD,如今估計人類基因組的7%由SD組成,即在總共31億個堿基對的人類基因組中,SD共有218 Mbp。SD占近端著絲的短臂的三分之二(68.1Mbp中的45.1Mbp),這些SD是人類基因組中最大的(見圖中的A部分)。此外,54%的近端著絲SD的拷貝數(shù)是可變的,或者在被研究的六個人中映射到不同的染色體上。相關(guān)研究結(jié)果發(fā)表在2022年4月1日的Science期刊上,論文標題為“Segmental duplications and their variation in a complete human genome”。 對目前參考基因組(GRCh38)和T2T-CHM13的SD含量進行詳細比較,發(fā)現(xiàn)有81Mbp的以前未解決的或結(jié)構(gòu)可變的SD。來自一個由268個人組成的多樣性小組的短讀全基因組序列數(shù)據(jù)顯示,人類拷貝數(shù)與T2T-CHM13相匹配的可能性為與GRCh38匹配的9倍(前者為59.26 Mbp,后者為6.55Mbp),包括119個蛋白編碼基因(見圖中的B部分)。 利用來自25個人類單倍型的長讀測序數(shù)據(jù),這些作者調(diào)查了人類遺傳變異的模式,發(fā)現(xiàn)結(jié)構(gòu)和單核苷酸多樣性的顯著增加。他們確定了基因豐富的區(qū)域(比如TBC1D3),這些區(qū)域在個體之間的差異達數(shù)十萬個堿基對和基因拷貝數(shù),顯示了一些最高的全基因組結(jié)構(gòu)雜合度(85%至90%)。 更完整的片段重復(fù)改善了基因分型。圖片來自Science, 2022, doi:10.1126/science.abj6965。 他們的分析確定了182個候選蛋白編碼基因以及以前未解決的結(jié)構(gòu)可變基因模型的完整序列。其中包括脂蛋白A(LPA)的完整基因結(jié)構(gòu),包括擴大的kringle IV重復(fù)序列結(jié)構(gòu)域。這個結(jié)構(gòu)域的拷貝數(shù)減少是與心血管疾病最強的遺傳關(guān)聯(lián)之一,特別是在非洲裔美國人中,對多各人類單倍型的測序不僅發(fā)現(xiàn)了拷貝數(shù)變異,而且還發(fā)現(xiàn)了與疾病風險潛在相關(guān)的其他形式的罕見編碼變異。 最后,這些作者比較了重復(fù)基因(duplicated gene)和獨特基因之間的全局甲基化和表達模式。轉(zhuǎn)錄不活躍的重復(fù)基因更有可能映射到低甲基化的基因組區(qū)域;然而,具體到轉(zhuǎn)錄起始位點上,他們觀察到甲基化的增加,這表明多達三分之二的重復(fù)基因是表觀遺傳沉默的。此外,片段重復(fù)的基因在甲基化譜和轉(zhuǎn)錄水平之間顯示出高度的一致性,使得他們能確定高一致性的基因家族中活躍轉(zhuǎn)錄的成員,這些成員根據(jù)編碼序列是無法識別出來的。 綜上所述,完整的人類基因組提供了對重復(fù)基因的分布、表達和調(diào)節(jié)的更全面的理解。這些作者的分析揭示了之前尚未被認識的人類遺傳多樣性模式,并提出了甲基化和基因調(diào)控的特征。這一資源將作為改進基因注釋、基因分型和人類基因組中一些最活躍區(qū)域的先前未知關(guān)聯(lián)的重要基線。(生物谷 Bioon.com) 參考資料: Mitchell R. Vollger et al. Segmental duplications and their variation in a complete human genome. Science, 2022, doi:10.1126/science.abj6965. ![]() ![]() |
|