摘要 2019年12月爆發(fā)的新冠疫情之后,中國在世界層面表現(xiàn)出該有的大國擔當,為人類健康提供全球性治療幫助。SARS-CoV-2具有很高的傳染性,其致病性和致死率都隨著年齡的增長而增加,并具有很強的個體差異,為此深入了解其生物學特性的尤為重要。結構分析已經闡明了病毒結合區(qū)、突變和宿主中的特異性蛋白,如受體血管緊張素轉換酶2(ACE2)和跨膜蛋白酶絲氨酸2(TMPRSS2),它們與病毒進入細胞并形成感染性有關。此外,通過表觀遺傳的改變來調節(jié)染色質結構的現(xiàn)象對維持基因組穩(wěn)定和維持細胞內穩(wěn)態(tài)的十分重要,這種現(xiàn)象還與病毒感染的病理生理有關。表觀遺傳學研究表明,DNA甲基化以及ACE2基因甲基化和翻譯后組蛋白修飾可能導致宿主組織、生物學年齡和性別對病毒感染模式的差異。此外,病毒侵染后對宿主細胞表觀遺傳的調節(jié)是病毒用來對抗細胞信號的分子工具,以及調節(jié)宿主先天免疫誘導和防疫機制的傳感元件,進而提高病毒復制和感染的效率。 該文展示了表觀遺傳學和冠狀病毒之間的主要研究成果的最新進展。特別強調了干擾病毒復制和感染的表觀遺傳因素,及其對新冠病毒易感性的影響,為研究宿主對病毒的應答反應提供了新的思路。 關鍵詞:新冠肺炎;DNA甲基化;組蛋白PTMs;病毒感染;ACE2;X連鎖基因 1.介紹 冠狀病毒(CoV)是人類和動物的主要病原體家族,如嚴重急性呼吸綜合征冠狀病毒(SARS-CoV)和中東呼吸綜合征冠狀病毒(MERS-CoV)。2019年12月爆發(fā)的COVID-2019疫情,其根源是一種具有人類感染和傳播能力的高度傳染性冠狀病毒,據(jù)WHO稱,截至2020年7月8日,該病毒在全球造成543,902人死亡。SARS-CoV-2病毒的迅速傳播和宿主多樣性凸顯了深入了解其結構和生物學功能的必要性。新發(fā)布的實驗數(shù)據(jù)揭示了調節(jié)宿主反應的遺傳和表觀遺傳改變之間的關系。調控染色質結構的表觀遺傳學改變對基因組穩(wěn)定和維持細胞內環(huán)境平衡有很重要的影響,并與病毒感染的病理生理有關。 基因表達的表觀遺傳調控依賴于在染色質水平以及RNA和DNA水平上發(fā)生的翻譯后化學變化,主要包括甲基化,也包括乙?;?、磷酸化、泛素化和類泛素化。這種類型的調控通過改變基因位點的功能而不改變潛在的DNA序列來建立基因型和表型的聯(lián)系。 DNA甲基化是指DNA通過DNA甲基轉移酶(DNMT)將甲基添加到DNA胞嘧啶環(huán)C-5位的可遺傳的表觀遺傳過程。目前已確定了DNMT1、DNMT2、DNMT3A、DNMT3B和DNMT3L等5個家族成員,DNMT1優(yōu)先作用于半甲基化的DNA,在DNA復制過程中發(fā)揮重要作用。相比之下,DNMT3A和DNMT3B在未甲基化的CpG二核苷酸上發(fā)揮作用,并在發(fā)育過程中介導從頭甲基化。DNA甲基化高度參與細胞的發(fā)育和衰老過程,以及基因印記、X失活和沉默重復元件和轉座子的表達,確?;蚪M穩(wěn)定性方面起著關鍵作用。 此外,細胞核中的DNA以染色質纖維的形式包裹在核小體周圍,核小體是染色質的功能單位,由組蛋白八聚體(兩個二聚體H3-H4和兩個二聚體H2A-H2B)組成。組蛋白(PTM)的翻譯后修飾作為基因表達的結果可以干擾染色質的開放性。最常見的PTM發(fā)生在H3、H4的N端,主要由不同氨基酸殘基上的甲基化、乙酰化和磷酸化組成。這些位于相同或不同核小體的PTM結合和協(xié)同作用定義了所謂的“組蛋白密碼”,并決定了染色質的開放性和轉錄因子的結合。 最近在基因調控和RNA領域的研究揭示了發(fā)生在RNA水平上的化學修飾在基因轉錄、翻譯效率和RNA穩(wěn)定性方面的作用。核酸測序和質譜學方面的新技術使科學家能夠以更高的分辨率和精確度研究這些修飾。目前,已在不同的生物體和組織中發(fā)現(xiàn)了160多種修飾,這些修飾涉及RNA干擾等基本分子機制。這些修飾在癌癥領域的新興作用,使它們成為靶向藥物研發(fā)的理想候選者。 通過抗體pull-down或化學標記結合測序、納米孔測序和新的靶向質譜技術,對不同物種和組織的轉錄組中的RNA修飾進行了系統(tǒng)的測序,揭示了一系列RNA修飾,這些RNA修飾不僅在持家、非編碼RNA中含量豐富,包括轉運RNA(tRNA)和核糖體RNA(rRNA),而且在功能性mRNAs中也普遍存在。令人驚訝的是,一些圖譜修飾顯示出動態(tài)模式和組織特異性分布,闡明了一個全新的RNA領域--表觀遺傳學或表觀轉錄組學。 轉錄和表觀轉錄分析在病毒研究中起著至關重要的作用,其通過確定病毒的結構和功能,從而提供了與宿主侵染有關的重要信息。來自RNA研究中心及其在韓國疾病控制和預防中心(KCDC)下屬的韓國國家衛(wèi)生研究所(KNHI)合作者的最新研究展示了SARS-CoV-2的高分辨率染色體圖?;诩{米載體的RNA直接測序被用來鑒定病毒轉錄本上的至少41個RNA修飾位點,最常見的觀察到的基序是存在于整個病毒基因組中的AAGAA。Poly(A)尾巴在RNA周轉中起著重要作用,有人認為這種內部修飾可能有助于病毒RNA的穩(wěn)定性和翻譯效率,從而體現(xiàn)了一種躲避宿主免疫反應的機制。 我們利用SARSCoV-2侵染背后的遺傳和表觀遺傳之間的聯(lián)系,來解釋與病毒感染相關的組織或細胞、年齡、性別偏好以及并發(fā)癥的差異。 2.宿主遺傳學與SARS-CoV-2感染 SARS-CoV-2是一種非典型肺炎(β)冠狀病毒,其基因組為29kb的正鏈單鏈包膜RNA。它與中東呼吸綜合征冠狀病毒(MERS-CoV)有50%的同源性,與SARS-CoV有80%的同源性。雖然最初被認為是禽類和哺乳動物的地方性感染,但跨物種傳播是可能導致在人類中暴發(fā)的主要原因。 病毒進入宿主細胞的位點是血管緊張素轉換酶2(ACE2)I型膜受體,存在于動脈和靜脈內皮細胞、肺泡Ⅱ型細胞、小腸的腸細胞以及包括大腦皮層和腦干在內的大多數(shù)器官的動脈平滑肌細胞。ACE2是一種含鋅的金屬酶,含有一個腎臟氨基酸轉運體結構域和一個肽酶M2結構域,它通過將血管緊張素I激素分解成收縮血管的血管緊張素II來平衡血管緊張素轉換酶。然后,ACE2從血管緊張素II的羧基末端裂解苯丙氨酸殘基,生成血管擴張劑血管緊張素。 一旦病毒進入宿主細胞,它就會復制由9個實驗驗證的ORFs組成的基因組RNA。由基因組RNA轉錄而來的9個亞基因組RNA編碼保守的結構蛋白,即合成病毒顆粒的刺突蛋白(S)、包膜蛋白(E)、膜蛋白(M)和核衣殼蛋白(N)。數(shù)據(jù)表明,SARS-CoV蛋白被跨膜絲氨酸蛋白酶2(TMPRSS2)、組織蛋白酶L(CTSL)和弗林蛋白酶(Furin)等蛋白酶切割,將堿性氨基酸裂解酶(Furin)分別切割成兩個亞基,分別為S1和S2(圖1A,B)。 SARS-CoV-2利用包含核心結構和受體結合基序(RBM)的S蛋白的受體結合域(RBD)與受體外表面結合并進入宿主。人類ACE2含有的兩個病毒易結合位點以及在這些位點附近自然發(fā)生的RBM突變,可以確定病毒的宿主范圍(圖1B,C)。根據(jù)結構數(shù)據(jù)分析,SARS-CoV-2與人血管緊張素轉換酶2(ACE2)可以高度結合。已檢測到位于501位的單個N501T突變可顯著增強SARS-CoV-2 RBD結合能力。這種突變在已感病患者中經常被發(fā)現(xiàn),因此對ACE2的501殘基密切監(jiān)測觀察是否有新的突變是很重要的。 以往對相關病毒SARS-CoV的研究表明,低水平表達ACE2的未分化上皮細胞感染能力較差,說明ACE2表達與冠狀病毒感染率密切相關。 此外,在新冠肺炎感染死亡的患者中發(fā)現(xiàn)了一系列并發(fā)癥,包括高血壓、狼瘡、糖尿病、癌癥和慢性阻塞性肺疾病。雖然這些合并癥患者病情加重的分子機制還不是很清楚,但有一些研究推測與ACE2有關。 最近的跨組織綜合分析表明,ACE2陽性細胞在多種器官中共表達TMPRSS2或CTSL,這些細胞與嚴重的疾病有關(包括肝、腎、胰腺的上皮細胞和嗅覺上皮細胞、心臟的心肌細胞、周細胞和成纖維細胞,以及腦中的少突膠質細胞)。因此,ACE2是病毒的入口點,這些并發(fā)癥很可能會影響ACE2的水平,進而直接影響病毒的傳播。 此外,在吸煙者的氣道基底層和多纖毛上皮細胞中也發(fā)現(xiàn)ACE2表達上調。有趣的是,單細胞RNA-Seq研究顯示ACE2在兒童樣本中的表達顯著降低,反映了ACE2基因座缺乏染色質開放性。此外,ACE2基因高甲基化可能發(fā)生在兒童肺部,降低其表達。 值得注意的是,ACE2在子宮內膜癌和腎乳頭狀細胞癌組織中的表達顯著升高,并與免疫細胞浸潤和預后呈正相關,因此與SARS-CoV-2感染的易感性有待進一步研究。 然而,需要注意的是,ACE2在不同組織中的表達調節(jié)是復雜的,既可以受到感染的影響,也可以受到包括ACE抑制劑或血管緊張素受體阻滯劑在內的常見療法的影響。 3.宿主表觀遺傳學與SARS-CoV-2感染 3a.X失活與COVID-19的關系 重要的是,作為SARS-CoV-2的受體,ACE2基因已經定位在X染色體上,并指向更接近于X失活(XCI)的表觀遺傳調控的發(fā)育過程。已證實哺乳動物雌性細胞中的兩條X染色體中的一條在分化過程中經歷X失活(XCI)過程,以實現(xiàn)雌雄之間的劑量補償。女性特有的非編碼RNA Xist從X失活中心轉錄而來,分布在整個X染色體上,通過組蛋白修飾蛋白、多梳抑制蛋白1(PRC1)和PRC2復合體的招募而形成一種不活躍現(xiàn)象。PRC1催化賴氨酸119(H2AK119Ub)上的組蛋白H2A單泛素化,而PRC2三甲基化賴氨酸27(H3K27me3)上的組蛋白H3,在XCI過程中主要維持基因沉默,提供了一個中間的表觀遺傳調節(jié)階段,并傳播了Xist RNA誘導的沉默狀態(tài)。 然而,XCI在人類中是不完整的,在女性細胞中,三分之一的X染色體基因同時在活躍的(Xa)和非活躍的(Xi)X染色體上表達,而逃脫X失活的基因被稱為“逃逸者”。 最近的一項研究說明了X染色體在幾個人體組織中的失活情況。他們系統(tǒng)地分析了來自基因組織表達(GTEx)項目(v6p發(fā)布)的449個個體的29個組織的5500個轉錄本。通過研究X染色體蛋白編碼基因和長非編碼RNA(LncRNA)基因和單細胞轉錄本的性別差異,以及基因組學數(shù)據(jù),發(fā)現(xiàn)雖然XCI在人類組織中大部分是一致的,但在細胞、組織和個體之間也可能存在一定的特異性。研究數(shù)據(jù)顯示,不完全XCI至少控制了23%的X染色體基因和7個逃逸基因。重要的是,逃避XCI會導致基因表達上的性別偏好,從而導致表型多樣性。在女性肺組織中發(fā)現(xiàn)了逃避X失活的基因中的ACE2,顯示出了更多的特異性性別偏好。此外,ACE2在男性組織中的表達略高于女性組織,并發(fā)現(xiàn)開放染色質標記與其表達譜相關,這可能為男性患者的呼吸道感染嚴重程度高于女性患者的現(xiàn)象提供了證據(jù)。 ACE2基因位于染色體進化較久遠的區(qū)域,Xq和該區(qū)域的基因表現(xiàn)出較低的表達和較高的組織特異性,這與較高的蛋白質進化速率有關。 在這方面,一項進化研究比較了人類、大鼠和小鼠的ACE2蛋白,發(fā)現(xiàn)了不同的SARS-CoV結合親和力。人SARS-CoV S1-CTD通過Lys31和Lys353兩個病毒結合點與人ACE2緊密結合。另一方面,大鼠蛋白含有兩個不同的殘基,一個是位于第353位的組氨酸(而不是賴氨酸),另一個是位于第82位的天冬氨酸,它引入了一個N-多糖,不利于SARS-CoV的結合。小鼠蛋白含有His353殘基,但在第82位不具有N-多糖,存在較差的受體。因此,大鼠ACE2不是SARS-CoV的受體,而小鼠ACE2與人ACE2相比是受體功能較差。 3b.ACE2基因位點的DNA甲基化和組蛋白修飾--破壞宿主免疫反應的機制 最近的研究表明,DNA甲基化參與了ACE2基因的調控,表明宿主表觀基因組可能是COVID-19感染的一個危險因素(表1)。通過分析來自四個不同的肺組織公共數(shù)據(jù)庫的DNA甲基化圖譜,他們能夠篩選出ACE2基因的兩個CpGs位點的DNA甲基化在性別之間的差異。此外,在呼吸道道上皮細胞ACE2基因轉錄起始點附近檢測到與年齡相關的DNA甲基化。研究者使用了來自不同生物年齡樣本的DNA甲基化數(shù)據(jù),發(fā)現(xiàn)ACE2轉錄起始點附近的一個CpG(Cg085599149)在老化過程中甲基化水平降低(圖1)。因此,對全基因組亞硫酸氫鹽測序的要求很高,以精確定位更多差異甲基化的CpG島,以與年齡有關的方式調節(jié)ACE2的表達。 之前的研究表明,全球DNA甲基化的水平在隨著衰老逐漸降低,導致炎癥、衰老和免疫反應相關的基因的甲基化模式不同。結合這些觀察結果,揭示了DNA甲基化至少是MERS冠狀病毒在體外對抗感染細胞過程中的抗原提呈基因,調節(jié)宿主獲得性免疫反應的主要機制之一。這些數(shù)據(jù)可以在一定程度上解釋老年人和有潛在疾病患者的病毒感染發(fā)病率較高的現(xiàn)象。此外,在子宮內膜癌和腎乳頭狀細胞癌組織中發(fā)現(xiàn)ACE2啟動子低甲基化,ACE2表達增加,這表明其可能激活自身并誘導其表達水平。當這些患者感染SARS-CoV-2時,ACE2水平降低,免疫浸潤受損,會影響其預后。 重癥的新冠肺炎與合并癥患者肺組織中ACE2的高表達有關。系統(tǒng)的實驗和網(wǎng)絡分析揭示了人類肺中ACE2的許多潛在調節(jié)因子,包括表達表觀遺傳酶的基因,如組蛋白乙?;D移酶1(HAT1)、組蛋白脫乙?;?(HDAC2)和賴氨酸脫甲基酶5B(KDM5B)。途徑富集分析表明,與ACE2正相關的基因受KDM5B、組蛋白特異性甲基化(H3K4me1和H3K4me3)和組蛋白乙?;?H3K27ac)標記的調控(圖1)。事實上,KDM5B通過去除組蛋白H3(H3K4)賴氨酸4上參與基因轉錄和DNA修復調節(jié)的活性染色質標記(如二甲基化和三甲基化)來調節(jié)染色質的開放性。這些修飾在ACE2位點被進一步發(fā)現(xiàn),這表明ACE2在肺中的表觀遺傳調節(jié)導致了ACE2的過量表達和疾病的加重。此外,在乳腺癌細胞中抑制KDM5B可以觸發(fā)干擾素反應,觸發(fā)對DNA和RNA病毒感染的抵抗,因此,KDM5B可能是COVID-19預防的一個潛在靶點。 另一種表觀遺傳酶--NAD依賴的組蛋白去乙酰化酶Sirtuin1(SIRT1)也可在細胞能量應激條件下調節(jié)ACE2,該酶在重癥的新冠肺炎并發(fā)癥患者肺組織中表達上調,這一發(fā)現(xiàn)值得進一步研究。 4. 關于SARS-CoV-2感染 除了ACE2,跨膜蛋白酶TMPRSS2也是SARS-CoV-2感染的關鍵調節(jié)因子。SARS-CoV-2感染后,會通過其表面的刺突蛋白(S)與血管緊張素轉換酶2(ACE2)結合。S蛋白由細胞膜絲氨酸蛋白酶TMPRSS2啟動,TMPRSS2允許其在S1/S2處切割,而S2位點可供病毒和細胞膜融合。 此外,除了針對病毒刺突蛋白(Spike Protein)產生的中和抗體外,正在測試一系列化合物阻斷TMPRSS2和ACE2蛋白的活性和結合能力。臨床批準的絲氨酸蛋白酶抑制劑甲磺酸卡莫司坦可以抑制TMPRSS2的活性,阻止SARS-2-S驅動的進入,這說明它有可能成為一種有效的治療方法。 到目前為止,很少有研究闡明針對ACE2基因表達的藥物的重要性。最近的一項研究篩選了兩個全基因組轉錄表達數(shù)據(jù)數(shù)據(jù)庫, Connectivity Map(CMAP)和JeaMoon Map(JMap),發(fā)現(xiàn)了一些候選藥物(吡啶酸、富維斯特朗、星孢菌素、AG-013608和硫唑嘌呤)可以降低呼吸道上皮中血管緊張素轉換酶2的表達,其中免疫抑制劑硫唑嘌呤是最有希望的。 此外,在新冠肺炎的研究中,表觀遺傳和表觀轉錄機制在調節(jié)ACE2X連鎖基因表達中起著重要作用。該基因啟動子上的DNA甲基化和H3K4甲基化已被發(fā)現(xiàn)影響其表達。此外,對Roadmap Epigenomics項目數(shù)據(jù)庫的分析表明,p300乙?;D移酶和H3K27ac位于ACE2基因的啟動子區(qū)域。 同源性很高的HATS、環(huán)磷酸腺苷(CAMP)反應元件結合蛋白(CREB)結合蛋白(CBP)和p300是活性增強子的成熟標記。研究表明,抑制p300 HAT活性會降低H3K27Ac的水平,主要是在增強子區(qū)域。目前已檢測到了一系列小分子、天然產物與p300的催化活性位點結合,影響靶基因的基因表達。 在最近的一項研究中,通過質譜儀的分析確定了26個SARS-CoV-2蛋白在人類細胞(PPI)中新的互作。令人驚訝的是,他們觀察到病毒的跨膜E蛋白與宿主細胞中含有2個溴結構域(BRD2)和BRD4的轉錄因子相互作用。溴結構域家族(BRD)、溴結構域和其他末端結構域家族(BET)是能夠識別乙?;旧|的表觀遺傳。它由4個成員(BRD2、BRD3、BRD4和BRDT)組成,BRD2和BRD4在N端與乙?;M蛋白結合,調節(jié)靶基因的轉錄。在病毒感染后,它們與模仿H3組蛋白尾巴N端與蛋白E的C末端相互作用。通常建議使用BET抑制劑來干預這種相互作用,并影響宿主細胞的轉錄機制和病毒的轉錄機制。 一些可能導致ACE2基因表觀遺傳沉默的天然化合物包括DNA甲基轉移酶抑制劑姜黃素、8-羥基喹諾酮和蘿卜硫素,它們對SARS-CoV-2感染顯示出潛在的預防作用。 5. 結論 綜上所述,表觀遺傳酶及其修飾在新冠肺炎治療中展現(xiàn)了極大的潛力。未來的研究應該集中于闡明這些化學修飾對病毒生命活動中的功能作用、感染效率和疾病的嚴重性以及避免宿主細胞攻擊的能力的影響。針對染色質開放性的候選藥物,RNA和DNA修飾,在未來可能對阻斷病毒的感染活性有很大的幫助,迫切需要新的研究來闡明它們的特異性和作用機制。 表1.人血管緊張素轉換酶2(ACE2)基因在不同細胞類型/組織中的表觀遺傳調控 圖1 A)冠狀病毒結構示意圖,嵌入脂質雙層膜的病毒表面蛋白(棘突、膜、包膜)、RNA和核衣殼核糖核蛋白。 B)SARS-CoV-2刺突蛋白的基因組結構,指示受體結合域(RBD)、受體結合基序(RBM)和七肽重復序列1,2(HR1,2)。還顯示了蛋白酶位點(位于687)可以被切割以產生S1和S2亞基。TM:跨膜 C)ACE2蛋白示意圖,表示多肽酶和結構域。 D)上圖:ACE2基因的線性示意圖(未按比例顯示),綠色框中是外顯子,內含子顯示為水平藍色線。CpG(cg085599149)位于ACE2轉錄起始點附近,該位點在衰老過程中發(fā)生了低甲基化,并顯示了組蛋白甲基化和乙酰化的標志。 下圖:ACE2蛋白,表明鋅肽酶(HEXXH基序)和結構域以及關鍵的多糖(第90位糖基化天冬酰胺)與SARS-CoV-2刺突結合有關。 |
|