基因(蛋白)常見的功能分析方法有:代謝信號通路(pathway)和GO(Gene ontology,基因本體論)分析。另外還有COG(Clusters of Orthologous Groups of proteins)、蛋白功能域(protein Domain)等分析。 功能分析的應(yīng)用非常普遍,以通路分析為例,其相關(guān)的文獻逐年增加,2015年相關(guān)的文獻有42926篇(圖1所示)。 所以說基因功能分析是一個非常普遍而且重要的分析內(nèi)容。 GO和pathway都是研究基因功能的,那么它們的區(qū)別是什么呢?在這里跟小伙伴們科普一下:GO主要是研究基因功能的,而pathway是研究基因和蛋白功能的,是不是一目了然了?GO功能主要分成三大類:BP(生物學(xué)過程)、MF(分子功能)和CC(細胞組成);其中最常用的就是GO BP分析。常見的pathway數(shù)據(jù)由KEGG、Reactome、Biocarta等。 ![]() 功能分析主要分成兩類:功能注釋分析和功能富集分析。 功能注釋分析是指對基因進行GO、pathway的注釋(Annotation),例如DDR1基因參與GO:0001558 regulation of cell growth、GO:0007155 cell adhesion、GO:0031100 organ regeneration等20個生物學(xué)過程(GO BP)。 功能富集分析是指對一個基因集(gene sets)進行富集分析,使用超幾何分布算法獲得該基因集中的基因顯著富集的功能。一般會有一個顯著性的閾值,例如p<0.05。結(jié)果如圖例所示。 報價:有參考基因組的功能注釋/富集分析,每組每種500元; 無參考基因組的功能注釋/富集分析,每組每種1000元; ![]() 圖例: A代表通路圖;B代表差異上下調(diào)基因的GO富集分析;C代表KEGG pathway富集分析; D代表GO和pathway富集分析 案例:膽道閉鎖小鼠模型中肝外膽管和膽囊基因 研究目的膽道閉鎖(BiliaryAtresia,BA)是一種肝內(nèi)外膽管出現(xiàn)阻塞并可導(dǎo)致淤膽性肝硬化天性膽道閉鎖而最終發(fā)生肝功能衰竭的疾患。輪狀病毒可導(dǎo)致小鼠患BA 疾病。因此我們利用輪狀病毒感染新生小鼠構(gòu)建的膽道閉鎖的時間表達譜,分析疾病樣本異常表達基因及其功能作用等,來闡述膽道閉鎖模型的分子機制。 方法結(jié)果 一、實驗設(shè)計實驗樣本設(shè)計如下:鹽水處理組織的對照樣本,處理時間點為3天(Day 3 after normal saline injection,簡稱Day3_NS)、7天(簡稱Day7_NS)、**天(簡稱Day**_NS),每個時間點3個樣本;輪狀病毒處理組織的實驗樣本,處理時間點為3天(簡稱Day3_RRV)、7天(簡稱Day7_RRV)、**天(簡稱Day**_RRV),每個時間點3個樣本。制作芯片。 二、表達數(shù)據(jù)預(yù)處理及差異表達分析芯片數(shù)據(jù)首先使用R軟件包RMA法預(yù)處理。隨后將探針轉(zhuǎn)換為對應(yīng)的gene symbol。對于多個探針匹配同一個gene symbol,取這些探針均值作為基因最終表達值。 計算分析Day3_RRV vs. Day3_NS、Day7_RRV vs. Day7_NS、Day**_RRV vs. Day**_NS,三個對比組的差異表達基因。使用R包提供的T檢驗的方法計算差異表達基因的顯著性P值。并使用BH方法矯正P值(即FDR)對于每個顯著差異表達基因,要求其差異表達的FDR小于0.05,同時要求log2FC的絕對值不小于1。 利用基因表達值可對多個數(shù)據(jù)集進行文氏圖分析,快速篩選出重要基因。我們輸入3個時間點差異表達基因和基因的log2FC值,觀察3個時間點差異表達基因的異同。文氏圖分析結(jié)果見圖1。有115個上調(diào)基因同時出現(xiàn)在3個時間點中,但是下調(diào)基因只有1個。后續(xù)進一步分析這116個基因。 ![]() 圖1 VennPlex文氏圖分析結(jié)果。0表示contra-regulated,指表達方向相反的基因,如day3和day7有1個表達方向相反的基因 三、差異表達基因功能富集分析使用富集分析工具分別分析每個時間點中上調(diào)和下調(diào)基因分別參與GO功能和KEGG通路。參數(shù)富集基因個數(shù)count>=2,超幾何檢驗顯著性閾值Pvalue<0.05(視為顯著富集結(jié)果)。 VennPlex文氏圖得到116個差異表達基因在3個時間點表達變化方向一致,基因功能富集結(jié)果見表1。 表1 差異表達基因的功能富集分析(每種結(jié)果只顯示TOP 5,其余的參見附表) Category Term Count PValue GOTERM_BP GO:0006955~immune response 53 9.85E-29 GOTERM_BP GO:0006952~defense response 48 5.82E-25 GOTERM_BP GO:0006954~inflammatory response 31 4.75E-19 GOTERM_BP GO:0009611~response to wounding 36 3.99E-18 GOTERM_BP GO:0006935~chemotaxis 20 1.33E-14 GOTERM_CC GO:0005576~extracellular region 76 4.66E-15 GOTERM_CC GO:0044421~extracellular region part 37 9.05E-08 GOTERM_CC GO:0005615~extracellular space 29 1.07E-07 GOTERM_CC GO:0009897~external side of plasma membrane 15 1.84E-05 GOTERM_CC GO:0009986~cell surface 18 3.13E-05 GOTERM_MF GO:0030246~carbohydrate binding 26 3.81E-10 GOTERM_MF GO:0003823~antigen binding 14 1.31E-09 GOTERM_MF GO:0004364~glutathione transferase activity 9 1.01E-08 GOTERM_MF GO:0016765~transferase activity 10 3.27E-07 GOTERM_MF GO:0030414~peptidase inhibitor activity 15 2.90E-06 PATHWAY mmu00480:Glutathione metabolism 16 1.84E-13 PATHWAY mmu00982:Drug metabolism 13 7.82E-08 PATHWAY mmu00980:xenobiotics by cytochrome P450 11 1.69E-06 PATHWAY mmu04062:Chemokine signaling pathway 17 2.51E-06 PATHWAY mmu04623:Cytosolic DNA-sensing pathway 8 2.04E-04注:BP代表生物學(xué)過程;CC代表細胞組成;MF代表分子功能;pathway代表KEGG pathway;count代表富集的基因個數(shù);p值為超幾何分布結(jié)果。 四、交集基因分析結(jié)合VennPlex文氏圖分析結(jié)果,篩選出在3個時間點表達方向一致的基因。預(yù)測分析調(diào)控這些基因的轉(zhuǎn)錄因子。預(yù)測分析調(diào)控這些靶基因的轉(zhuǎn)錄因子。我們選擇transfac和jaspar數(shù)據(jù)庫中收錄的轉(zhuǎn)錄因子和靶基因關(guān)系對。 ![]() 圖2 轉(zhuǎn)錄因子和靶基因調(diào)控網(wǎng)路,紅色節(jié)點屬于交集基因,三角形節(jié)點表示轉(zhuǎn)錄因子 |
|