來源:生物谷原創(chuàng) 2023-09-29 11:47 基因組測序揭示了人類群體中廣泛的基因變異。錯義變異是改變蛋白氨基酸序列的基因變異。致病性錯義變異(pathogenic missense variant)會破壞蛋白功能,降低生物的適應(yīng)能力,而良性錯義 基因組測序揭示了人類群體中廣泛的基因變異。錯義變異是改變蛋白氨基酸序列的基因變異。致病性錯義變異(pathogenic missense variant)會破壞蛋白功能,降低生物的適應(yīng)能力,而良性錯義變異(benign missense variant)的影響有限。 對這些基因變異進(jìn)行分類是人類遺傳學(xué)一直面臨的重要挑戰(zhàn)。在已觀察到的 400 多萬個錯義變異中,估計只有 2% 在臨床上被歸類為致病性錯義變異或良性錯義變異,而絕大多數(shù)錯義變異的臨床意義不明。這限制了對罕見病的診斷,也限制了針對潛在遺傳病因的臨床治療方法的開發(fā)或應(yīng)用。機器學(xué)習(xí)方法可能能夠利用生物數(shù)據(jù)中的模式來預(yù)測未注釋基因變異的致病性,從而彌補基因變異解釋方面的差距。具體來說,可以從蛋白序列中準(zhǔn)確預(yù)測蛋白結(jié)構(gòu)的AlphaFold可能可以作為預(yù)測蛋白變異致病性的基礎(chǔ)。 在一項新的研究中,來自Google DeepMind公司的研究人員開發(fā)了AlphaMissense 來利用了多方面的進(jìn)展:(i) 無監(jiān)督蛋白語言建模以了解以序列上下文為條件的氨基酸分布;(ii) 通過使用 AlphaFold 衍生系統(tǒng)納入結(jié)構(gòu)上下文;(iii) 對來自群體頻率數(shù)據(jù)的弱標(biāo)簽進(jìn)行微調(diào),從而避免人為注釋的偏差。AlphaMissense 在臨床注釋、從頭疾病變異和實驗檢測基準(zhǔn)中實現(xiàn)了最先進(jìn)的錯義致病性預(yù)測,而無需在此類數(shù)據(jù)上進(jìn)行明確的訓(xùn)練。作為科學(xué)界中的 一種資源,他們提供了人類蛋白質(zhì)組中所有可能的單氨基酸替換預(yù)測數(shù)據(jù)庫。他們在ClinVar數(shù)據(jù)集上使用精確度為90%的截止值,將32%的錯義變異分類為可能致病的,57%的錯義變異分類為可能良性的,從而為大多數(shù)人類錯義變異提供了可靠的預(yù)測。相關(guān)研究結(jié)果發(fā)表在2023年9月22日的Science期刊上,論文標(biāo)題為“Accurate proteome-wide missense variant effect prediction with AlphaMissense”。 這些作者展示了如何利用這一資源加速多個領(lǐng)域的研究。分子生物學(xué)家可能能夠利用該數(shù)據(jù)庫作為起點,設(shè)計和解釋探測整個人類蛋白質(zhì)組中飽和氨基酸替換的實驗。人類遺傳學(xué)家可能能夠?qū)⒒蛩缴系?AlphaMissense 預(yù)測與基于群體隊列的方法結(jié)合起來,定量確定基因的功能意義,尤其是對于較短的人類基因,因為在較短的人類基因中,基于群體隊列的方法缺乏統(tǒng)計能力。最后,臨床醫(yī)生在對罕見病診斷中的從頭變異進(jìn)行優(yōu)先排序時,可能能夠從有把握分類的致病變異覆蓋范圍的擴大中獲益,而且AlphaMissense 預(yù)測可能能夠為使用了罕見的、可能是有害變異的注釋的復(fù)雜性狀遺傳學(xué)研究提供信息。 AlphaMissense致病性預(yù)測。圖片來自Science, 2023, doi:10.1126/science.adg7492。 綜上所述,AlphaMissense 預(yù)測可能闡明錯義變異對蛋白功能的分子影響,有助于識別致病性錯義變異和以前未知的致病基因,并提高罕見遺傳病的診斷率。AlphaMissense 還將促進(jìn)從結(jié)構(gòu)預(yù)測模型中進(jìn)一步開發(fā)專門的蛋白變異效應(yīng)預(yù)測工具。(生物谷 Bioon.com) 參考資料: Jun Cheng et al. Accurate proteome-wide missense variant effect prediction with AlphaMissense. Science, 2023, doi:10.1126/science.adg7492. |
|