今天應(yīng)該是本系列文章的第三篇了,不知大家有沒(méi)有視覺(jué)疲勞?咳咳,當(dāng)然了,本宮也就是禮貌性地問(wèn)一問(wèn),此類文章還有許多,寫還是會(huì)寫的。 今天的文章是'MicroRNA and Transcription Factor Gene Regulatory Network Analysis Reveals Key Regulatory Elements Associated with Prostate Cancer Progression',發(fā)表在PLOS ONE上(此雜志本宮就不多作介紹了),作者都是歪國(guó)仁,單位以伊朗的為主,還有印度的和土澳的,估計(jì)是伊朗的人去那倆地方留學(xué),別問(wèn)本宮為何知道的辣么多~ 言歸正傳,本文研究的是前列腺癌,用的樣本是對(duì)應(yīng)的非癌樣本以及轉(zhuǎn)移和非轉(zhuǎn)移3組樣本,主要方法是構(gòu)建miRNA、mRNA與轉(zhuǎn)錄因子(TF)的調(diào)控網(wǎng)絡(luò),來(lái)揭示比較癌癥轉(zhuǎn)移和非轉(zhuǎn)移組中的Keg基因。 下面介紹一下文章的主要思路和方法 1、GEO數(shù)據(jù)集獲取和差異基因篩選 這也算是老套路了,作者選取的數(shù)據(jù)集是GSE21032,這個(gè)數(shù)據(jù)集是個(gè)很大的數(shù)據(jù)集,作者從218個(gè)樣本中挑選出139個(gè)miRNA和mRNA均有數(shù)據(jù)的樣本進(jìn)行分析。差異基因的篩選標(biāo)準(zhǔn)也是P<0.05和log(fc)的絕對(duì)值>1,這部分可以直接用GEO2R分析再用EXCEL簡(jiǎn)單處理即可,小張之前也介紹過(guò)。最終,作者在原發(fā)癌組、轉(zhuǎn)移組中分別篩選出下圖所示的差異miRNA、mRNA以及TF,當(dāng)中有一些有交集,有一些沒(méi)有完全沒(méi)有交集(比如上調(diào)的TF)。 2、生物學(xué)功能分析 作者對(duì)差異mRNA進(jìn)行了GO分析,利用的工具是Cytoscape的插件BiNGO。通過(guò)下列的網(wǎng)絡(luò)圖簡(jiǎn)單地闡述了疾病與相關(guān)生物學(xué)功能的關(guān)系。 3、TF調(diào)控網(wǎng)絡(luò)分析與miRNA調(diào)控網(wǎng)絡(luò)分析 TF與基因的關(guān)系通過(guò)TRANSFAC數(shù)據(jù)庫(kù)獲取,這個(gè)數(shù)據(jù)庫(kù)是TF數(shù)據(jù)庫(kù)中公認(rèn)的比較好用的數(shù)據(jù)庫(kù),然而不是一個(gè)完全免費(fèi)的數(shù)據(jù)庫(kù),免費(fèi)使用只能使用截止到05年的數(shù)據(jù),如果在高校中有條件的童鞋,可以試試這個(gè)數(shù)據(jù)庫(kù)。獲取了TF-mRNA配對(duì)的相關(guān)數(shù)據(jù)之后,再在芯片數(shù)據(jù)中分析TF與mRNA的相關(guān)性(利用皮爾森相關(guān)性系數(shù))。miRNA與基因的關(guān)系如何預(yù)測(cè)想必大家應(yīng)該比較熟悉了,之前的文章中已經(jīng)介紹了許多miRNA相關(guān)的數(shù)據(jù)庫(kù),作者用了MirTarbase、miRanda和TargetScan三個(gè)數(shù)據(jù)庫(kù)來(lái)預(yù)測(cè)miRNA與mRNA的作用關(guān)系。同樣的,作者利用表達(dá)相關(guān)性進(jìn)行進(jìn)一步篩選以降低假陽(yáng)性率。 網(wǎng)絡(luò)構(gòu)建好了,key基因如何篩選?本文中作者主要應(yīng)用了兩個(gè)網(wǎng)絡(luò)拓?fù)浣Y(jié)構(gòu)參數(shù),一個(gè)就是之前常說(shuō)的degree,另一個(gè)是中介中心性(Betweeness Centrality),這是一個(gè)網(wǎng)絡(luò)中地位重要性的圖論概念,簡(jiǎn)單的說(shuō)就是中心性越高表示該節(jié)點(diǎn)在網(wǎng)絡(luò)中的重要性越高。這兩個(gè)參數(shù)利用Cytoscape的CentiScape插件都可以輕松搞定。 4、生存分析 最終作者篩選出兩個(gè)關(guān)鍵的轉(zhuǎn)錄因子HOXD10和PGR,并運(yùn)用生存分析進(jìn)行驗(yàn)證,結(jié)果表明這兩個(gè)轉(zhuǎn)錄因子確實(shí)在前列腺癌的轉(zhuǎn)移過(guò)程中起到了重要作用。 小結(jié):利用數(shù)據(jù)庫(kù)或者軟件預(yù)測(cè)出來(lái)的結(jié)果往往會(huì)出現(xiàn)假陽(yáng)性,比如說(shuō)TRANSFAC數(shù)據(jù)庫(kù)對(duì)轉(zhuǎn)錄因子的預(yù)測(cè),是基于Bind Sites的預(yù)測(cè),Bind Sites位于Gene的調(diào)控區(qū)內(nèi),是很短的一段序列,與轉(zhuǎn)錄因子結(jié)合,調(diào)控基因轉(zhuǎn)錄,由于Bind Sites本身太短,所以特異性較差,預(yù)測(cè)出來(lái)的結(jié)果可能很多都是假陽(yáng)性的,所以我們要通過(guò)進(jìn)一步的篩選,比如文章中用的基因表達(dá)的相關(guān)性分析,網(wǎng)絡(luò)拓?fù)浣Y(jié)構(gòu)分析等等來(lái)降低假陽(yáng)性率,最后再通過(guò)生存分析驗(yàn)證,讓整個(gè)文章的結(jié)果有理有據(jù)讓人信服。其它的數(shù)據(jù)庫(kù)比如miRNA靶基因的預(yù)測(cè),我們往往需要用多個(gè)數(shù)據(jù)庫(kù)的結(jié)果取交集,也同樣是為了提高數(shù)據(jù)的可信度。 最后說(shuō)一下科研手冊(cè)——生信特輯的事,獲取方式為: |
|