來源:生物谷原創(chuàng) 2022-09-07 15:56 在一項(xiàng)新的研究中,來自美國紐約基因組中心、麻省總醫(yī)院、耶魯大學(xué)和人類基因組結(jié)構(gòu)變異聯(lián)盟等研究機(jī)構(gòu)的研究人員擴(kuò)展了1kGP資源。 七年前,千人基因組計(jì)劃(1000 Genomes Project, 1kGP)發(fā)布了一個(gè)開放性資源,主要基于代表世界五大洲26個(gè)人群的2504人的低覆蓋率全基因組測序(WGS)數(shù)據(jù),從而首次大規(guī)模提供人類遺傳變異目錄。 如今,在一項(xiàng)新的研究中,來自美國紐約基因組中心、麻省總醫(yī)院、耶魯大學(xué)和人類基因組結(jié)構(gòu)變異聯(lián)盟(Human Genome Structural Variation Consortium, HGSVC)等研究機(jī)構(gòu)的研究人員擴(kuò)展了1kGP資源,除了原始樣本外,幾乎納入所有的親子三人組(parent-child trios),并使用Illumina NovaSeq儀器對它們進(jìn)行高覆蓋率測序。他們對擴(kuò)展后的1kGP隊(duì)列---如今由3202個(gè)樣本組成,包括602個(gè)親子三人組---的高覆蓋率WGS數(shù)據(jù)進(jìn)行了全面分析。相關(guān)研究結(jié)果發(fā)表在2022年9月1日的Cell期刊上,論文標(biāo)題為“High-coverage whole-genome sequencing of the expanded 1000 Genomes Project cohort including 602 trios”。 論文共同通訊作者、紐約基因組中心計(jì)算生物學(xué)科學(xué)主任Michael Zody博士解釋說,“1kGP隊(duì)列是一個(gè)非常有價(jià)值的資源,我們認(rèn)為使用最新版本的短讀技術(shù)將測序更新到最新版本,同時(shí)增加以前遺漏的家族樣本的豐富性,這對科學(xué)界是非常有用的?!?/p> 通過使用最先進(jìn)的方法和算法,來自紐約基因組中心的研究人員對來自這一擴(kuò)展隊(duì)列的淋巴樣干細(xì)胞(lymphoblastoid cell line, 簡稱LCL,即來自外周血的永生化人類B細(xì)胞)的DNA進(jìn)行測序,目標(biāo)深度為30倍基因組覆蓋。接下來,他們進(jìn)行了單核苷酸變異(SNV)和短時(shí)插入/缺失(insertion and deletion, INDEL)識別,包括從序列數(shù)據(jù)中識別相對于人類參考基因組的變異位點(diǎn),并對這一隊(duì)列中所有樣本中發(fā)現(xiàn)的變異位點(diǎn)進(jìn)行基因分型。 此外,來自哈佛醫(yī)學(xué)院、布羅德研究所和麻省總醫(yī)院的Michael Talkowski博士團(tuán)隊(duì)與耶魯大學(xué)和華盛頓大學(xué)醫(yī)學(xué)院的Ira Hall博士團(tuán)隊(duì)以及人類基因組結(jié)構(gòu)變異聯(lián)盟合作,通過整合多種分析方法,在3202個(gè)1kGP樣本中發(fā)現(xiàn)了一套全面的結(jié)構(gòu)變異(structural variant)并進(jìn)行了基因分型。 總體來說,這項(xiàng)新研究顯示,變異識別(variant call)的發(fā)現(xiàn)能力和精確度都有了明顯的提高,特別是在罕見的SNV以及INDEL和不同頻率出現(xiàn)的結(jié)構(gòu)變異中,這些都是以前低覆蓋率測序所不能接觸到的。 原始1kGP資源的一個(gè)重要方面是它被用作變異填補(bǔ)(variant imputation)的參考序列集,即根據(jù)從參考序列集上了解到的通常在人群中一起遺傳的變異分組,對稀疏的、基于陣列的樣本中未觀察到的基因型進(jìn)行統(tǒng)計(jì)推斷,這促進(jìn)了許多全基因組關(guān)聯(lián)研究(GWAS)。如今,隨著這個(gè)原始資源的擴(kuò)展,這些作者升級了用作變異填補(bǔ)的參考序列集,以包括更多通過高覆蓋率的全基因組測序和親子三人組家族發(fā)現(xiàn)的變異。 圖片來自Cell, 2022, doi:10.1016/j.cell.2022.08.004。 論文共同第一作者、紐約基因組中心高級生物信息學(xué)科學(xué)家Marta Byrska-Bishop博士解釋說,“這個(gè)新的用于變異填補(bǔ)的參考序列集包括更多的位點(diǎn),特別是許多更常見的INDEL和結(jié)構(gòu)變異,從而擴(kuò)展了GWAS可獲得的變異數(shù)量,鑒于非SNV變異的效應(yīng)大小較大,這可能能夠發(fā)現(xiàn)新的遺傳關(guān)聯(lián),幫助確定致病變異?!?/p> 所有的原始序列數(shù)據(jù)和變異識別集在測序完成后立即通過幾個(gè)基因組數(shù)據(jù)庫向公眾發(fā)布,包括國際基因組樣本資源(IGSR)。 論文共同第一作者、麻省總醫(yī)院基因組醫(yī)學(xué)中心博士后Xuefang Zhao博士補(bǔ)充說,“我們的目標(biāo)是讓這個(gè)公共資源成為未來群體遺傳研究和方法開發(fā)的基準(zhǔn)。” 這些數(shù)據(jù)已經(jīng)引起了遺傳學(xué)和基因組學(xué)界的興趣。由于1kGP樣本的完全開放獲取特性,這種情況可能會(huì)在未來幾年繼續(xù)下去。與大多數(shù)新出現(xiàn)的WGS工作不同,1kGP樣本被同意公開發(fā)布基因數(shù)據(jù),沒有訪問或使用限制。(生物谷 Bioon.com) 參考資料: 1. Marta Byrska-Bishop et al. High-coverage whole-genome sequencing of the expanded 1000 Genomes Project cohort including 602 trios. Cell, 2022, doi:10.1016/j.cell.2022.08.004. 2. Researchers expand and upgrade the 1000 Genomes Project resource using whole-genome sequencing |
|