Integrative analysis of genomic and epigenomic regulation of the transcriptome in liver cancer文章關鍵詞:肝癌,DNA甲基化,組蛋白修飾,轉(zhuǎn)錄組近年來聯(lián)合多組學分析已經(jīng)成為表觀領域的研究熱點,利用單一組學數(shù)據(jù)分析致病因子的局限性愈發(fā)顯著。通過對多種層次和來源的高通量組學數(shù)據(jù)的整合分析,系統(tǒng)地研究臨床發(fā)病機理、確定最佳疾病靶點已經(jīng)成為精準醫(yī)學研究的重要發(fā)展方向。 多組學聯(lián)合分析將有助于人們更加系統(tǒng)全面的認識腫瘤的生物學行為,進一步為尋找有價值的腫瘤標志物和探討腫瘤相關機制提供新的線索。今年來多組學在肺癌,胃癌等癌癥的研究當中取得了不錯的研究進展隨著組學分析技術的不斷發(fā)展,整合基因組,表觀組,轉(zhuǎn)錄組等組學分析,可以多層級全面的了解腫瘤的發(fā)生發(fā)展機制。。這篇NC文章聚焦在了肝癌這個腫瘤上面,看看組學分析能夠得到什么有意思的發(fā)現(xiàn)呢? 簡單介紹一下今天的主角:HCC,肝細胞癌(Hepatocellular carcinoma HCC)是常見的惡性腫瘤類型之一,在全球癌癥死亡原因中排名第二,大約90%的原發(fā)肝癌都屬于肝細胞癌。中國是HCC患病率最高的地區(qū),每年約50%以上的新診斷和死亡的病例都發(fā)生在中國,并且我國被診斷為肝癌的患者平均年齡為55-59歲,比國外肝癌低發(fā)率國家要早近20年[1,2,3]。肝細胞癌(Hepatocellular carcinoma,HCC),全球惡性癌癥死因“惡名榜”第二。中國是HCC的重災區(qū),不僅“貢獻”50%的全球HCC新發(fā)和死亡病例,且平均年齡55-59歲比國外HCC低發(fā)國家早近20年。 一:Summary? 作者從以轉(zhuǎn)錄組的數(shù)據(jù)入手,結(jié)合基因組數(shù)據(jù)和表觀數(shù)據(jù)進行差異分析??茨懿荒苷业?/ins>與肝癌的發(fā)生發(fā)展密切相關的異?;蚧蛘呤峭?。 ?這篇文章主要關注)肝癌轉(zhuǎn)錄組學基因和表觀遺傳的差異[1] [2] 主要研究思路是:1.分析64個肝癌病人樣本中,DNA甲基化(METcor)和DNA拷貝數(shù)變異(CNVcor),探究兩者是否在肝癌發(fā)病上存在“共調(diào)控”作用(這里增加用到的技術手段,如富集分析、熱圖分析,下面亦然,讀者一開始看到這里會介紹不同工具的實際應用才有繼續(xù)讀下去的欲望,反正我是這個樣子的) 2.進一步研究,能否根據(jù) MET cor和CNV cor進行肝癌分型,在TCGA數(shù)據(jù)庫中進行驗證(NMF算法) 3.篩選對HCC侵襲性影響最大的基因變異BAP1,用Huh7細胞轉(zhuǎn)染實驗進行驗證. ??2:Multi-omics integration of the CNVcor and METcor genes
reveal three prognostic subtypes of hepatocellular cacinoma. which can be
validated by an independent data. ??3:The most aggressive subtype expression stemness genes has frequent BAP1
mutations, implying its pivotal role in the aggressive tumorprogression. 帶著問題去思考: 二:Introduction1:DNA methylation and CNV aberrationor
mutation occur in cancer progression. 2:As HCC, genomic profiling studies demonstrated
the enormous heterogeneity of genomic and epigenomicderegulation. 3:In previous study, several key cancer-related
gene such as IGF2 UHRF1 regulation function by DNA
methylation 4:The transcription has influenced by the CNV
and DNA methylation , whether it has co-correlation is unclear . 5:Genomic and epigenomic profiles of DNA
copy-number variation (CNV), DNA methylation (MET), and gene expression (EXP)
were obtained from 64 HCC patients 三:Result3.1 Transcriptome deregulation by DNA copy number or methylation(DNA甲基化和拷貝數(shù)變異會導致轉(zhuǎn)錄失調(diào)) Transcriptome deregulation by DNA copy number or methylation.png a. 分別計算DNA甲基化MET[5] 和mRNA表達的相關性(藍色的),CNV和mRNA表達的相關系(紅色的),然后發(fā)現(xiàn)DNA甲基化(MET)是和表達呈負相關的,而CNV和表達呈正相關(因為DNA甲基化MET相關性系數(shù)分布偏左邊為-0.153,反之~) a圖關注的點 b.在a圖的基礎上,需要找到差異顯著的那些基因,然后|r|>0.5,也就是紅圈圈的位置,然后發(fā)現(xiàn)了CNVcor有813個,METcor有321個。把這幾個基因集進行求交集發(fā)現(xiàn)了只有24個overlap基因. ps:拿到這些基因做了一個富集分析,發(fā)現(xiàn)CNV差異基因富集在蛋白相關的信號通路上,MET的差異主要富集在炎癥反應等上面(感覺富集到的結(jié)果可能做不出什么文章。然后繼續(xù)往下看) 富集分析結(jié)果 c. CNV基因顯示出了它的一個基因組偏好性,比較集中在8號染色體上。DNA甲基化的基因在全基因組上分布沒有偏好性。 d.(左圖) 發(fā)現(xiàn)DNA甲基化的基因一般都分布在inter-genic(基因間區(qū))而不是CpG島。(右圖)發(fā)現(xiàn)DNA甲基化更偏向于發(fā)生在基因body區(qū)域,推測開放區(qū)域的甲基化可能會導致轉(zhuǎn)錄異常,芯片中CpG島的表達方式N_shore,N_shelf等。[6] [7] e:因為已經(jīng)拿到了60多個病人樣本,計算每個病人樣本的CNVcor上調(diào)和下調(diào)的基因個數(shù),METcor上調(diào)和下調(diào)的個數(shù)。然后畫出e的柱狀圖。(不同顏色代表上下調(diào)的基因)下面那個熱圖的意思就是說紅色的上調(diào)的,藍色的是下調(diào)的基因位點。 f:去尋找CNVcor上調(diào)和下調(diào)基因和METcor上調(diào)和下調(diào)的相關性。每個點代表著一個病人樣本。橫縱坐標代表這個病人的差異基因的個數(shù),然后做了一個相關性分析。(但是這個相關性系數(shù)值不大,最大的0.86,CNV_DOWN和MET_DOWN有正相關,其他的都是弱相關了) Q:這整個一個大Figure說明了什么? A:個人認為是確定DNA甲基化和拷貝數(shù)變異適合轉(zhuǎn)錄組異常相關的,至于有多么相關,數(shù)據(jù)給出信息。 3.2 Molecular subtype based on CNVcor and METcor genes對于CNV和MET差異表達基因可以用于肝癌的分子分型 Identification of molecular subtypes of HCC using CNVcor and METcor genes.
[iCluster,:一種可以利用R包進行分類的分類方法,詳情可以見:http://www./packages/devel/bioc/html/iClusterPlus.html] d:用K-Mean的方法畫出利用icluster方法分類的這種類型的OS,TTR曲線,看看分類效果。 【我們還比較了iCl1,iCl2和iCl3亞組的臨床病理特征,發(fā)現(xiàn)iCl1腫瘤比iCl2或iCl3的侵襲性更強(P = 0.002,表1)。 其他臨床特征在亞組之間沒有差異。 這些結(jié)果與分子亞型的獨特侵襲性特征一致。 基于這些發(fā)現(xiàn),我們建議CNVcor和METcor基因的綜合分析可以識別分子亞型,每個分子亞型具有與轉(zhuǎn)錄失調(diào)相關的基因組和表觀基因組特征的不同組合,與不同的預后結(jié)果相關?!?/span> Q:得到了這個分類結(jié)果,相當于一個訓練集,那么如何驗證這個訓練集的分類效果呢? 3.3 Validation of the molecular subtypes in an TCGA data setValidation of the molecular subtypes in an TCGA data set.png 這個目的就是為了在大樣本庫中重復他們之前結(jié)果,用的數(shù)據(jù)是TCGA的數(shù)據(jù) b,c:尋找差異的基因,求交集,發(fā)現(xiàn)CNVcor基因在8號染色體進行富集和之前一致 d.e: METcor基因在open sea區(qū)域和gene body域比在CpG島和TSS區(qū)域富集更頻繁 此外,異常CNVcor和METcor基因的頻率之間的相關性也得到驗證,相關性0.82. f,g :分類效果,C1組DNA拷貝數(shù)和DNA甲基化畸變率最高,C3組最低 h:OS,RFS分析圖 Q:發(fā)現(xiàn)利用CNV和DNA甲基化是可以用作分子分型的,大樣本也重復出來了結(jié)果,接下來如何分析呢?如何去找DNA甲基化和拷貝數(shù)變異的關系呢? 我們接下來看看作者如何借助統(tǒng)計學去試圖尋找答案 3.4 Coordinated aberrations of DNA copy numbers and methylation整合DNA甲基化數(shù)據(jù)和拷貝數(shù)變異數(shù)據(jù) Coordinated aberrations of DNA copy numbers and methylation 圖a,b整合了TCGA的數(shù)據(jù)和他們自己已有的數(shù)據(jù)進行分析。 在C圖中,我們可以看到橫坐標是CNV頻率,縱坐標是MET頻率,可以看出他們有顯著的相關性 在圖d,e,f,g中,分別以CNV gain ,CNV lose,MET gain ,MET loss進行坐標變換。然后都發(fā)現(xiàn)他們的之間的相關性與橫縱坐標軸的變量變化無關。 (雖然不太明白它這么比的目的是啥) 3.5 Identification of genomic key features in the HCC subtypesIdentification of genomic key features in the HCC subtypes a:TCGA中肝癌的數(shù)據(jù)樣本分析,剔除了同義突變后,篩選出在189個發(fā)生10次以上突變的重復突變基因,我們鑒定出37個差異突變基因,其中>5 %的突變頻率在C1、C2、C3亞型之間存在差異(其中有2個肝癌樣本沒有基因組突變數(shù)據(jù)),發(fā)現(xiàn)了BAP1是C1突變的最頻繁的基因。CTNB1是C2,C3當中突變最頻繁的基因,而且和腫瘤的發(fā)展高度相關。 b:GeneMania軟件做的圖(基因間相互作用的,可以在cytocsape里面裝這個插件,也可以去分析網(wǎng)站GeneMANIA,網(wǎng)址: http://),為了找到亞型的功能決定區(qū)域,利用SNU和TCGA數(shù)據(jù)交集CNVcor genes (n?=?95) and METcor genes (n?=?179)進行分析,發(fā)現(xiàn)了UBC 這個基因在CNV基因集中相關系數(shù)很高。(越靠中心說明了越重要。) c:先對這兩個基因集求一下交集,找到相同的差異的上調(diào)或者下調(diào)的基因。舉個例子來說:CA9是iCl1/C1腫瘤中上調(diào)表達差異最大的基因。(在文獻中,CA9是缺氧的一個標志物,其過表達在HCC19中是一個不好的預后標志物。此外,與其他亞型相比,侵襲性iCl1和C1腫瘤表達了高水平的干細胞相關基因,如KRT19、EPCAM和PROM1。與Rhee, H等人.報道的CA9的表達與HCC中干細胞相關表型相關[11] [12] 的結(jié)果符合[4]。) ??基于這個可能和干性[13] 有關的特性,進一步評估已知的和干性相關的基因集(即, ESC、Nanog、Oct4、Sox2、Myc1、Myc2等已知的和細胞干性相關的基因集)。在熱圖中,黃色代表高表達,藍色代表低表達,發(fā)現(xiàn)在IC1,C1中這些干性的基因集高表達了。說明和這些差異表達的基因和腫瘤干性有關系。 (PS:腫瘤干細胞(CsC)理論認為腫瘤的發(fā)生、發(fā)展、轉(zhuǎn)移和復發(fā)與CsC密切相關,對CSC的研究已成為腫瘤研究的熱點。自我不斷的更新復制以及保持分化的潛能是干細胞的特性。Sox2、Nanog等轉(zhuǎn)錄因子是維持干細胞干性的核心轉(zhuǎn)錄因子,那么有關于這些轉(zhuǎn)錄因子的表達情況是作者探究肝癌細胞是否具有干性的核心關注點。) ??綜上所述,這些發(fā)現(xiàn)提示,與DNA拷貝數(shù)和DNA甲基化相關的HCC分子亞型也與BAP1和CTNNB1突變有關,這可能在HCC亞型進展中發(fā)揮調(diào)控作用。對于分類結(jié)果來說,我們認為C1和iCl1腫瘤可能具有這些亞型的共同功能特征,如侵襲性或干性。我想知道為什么這里分析出兩個突變,后面只驗證了一個:因為C1是惡性程度最高的HCC,所以更關注BAP1,另外一個就不詳細研究 d:展示了BAP1抑制對肝癌細胞干細胞基因表達的影響。Huh7細胞通過轉(zhuǎn)染以BAP1 shrna,下調(diào)BAP1的表達,發(fā)現(xiàn)了包括CA9、KRT19、EPCAM、PROM1在內(nèi)的stemness基因的顯著上調(diào)表達。這些結(jié)果有力地支持了我們的發(fā)現(xiàn),即BAP1突變可能至少在一定程度上促進了一種侵襲性HCC亞型表達。 這篇文獻的主圖基本上就講到這里了??赐曛笏伎贾暗膯栴}: 回到之前的問題: 文獻thinking: 本文首發(fā)于 ”百味科研芝士“ 微信公眾號 |
|