日韩黑丝制服一区视频播放|日韩欧美人妻丝袜视频在线观看|九九影院一级蜜桃|亚洲中文在线导航|青草草视频在线观看|婷婷五月色伊人网站|日本一区二区在线|国产AV一二三四区毛片|正在播放久草视频|亚洲色图精品一区

分享

數(shù)據(jù)挖掘,我們有秘密武器(下)

 yjt2004us 2019-02-14

我們上一期介紹了數(shù)據(jù)挖掘中的表達(dá)量挖掘法(回顧戳這里?),相信大家都已經(jīng)了解了四大利器的威力,那么今天我們就帶大家接著了解一下功能挖掘法和尋找“明星”的數(shù)據(jù)挖掘方法吧。


圖1.轉(zhuǎn)錄組數(shù)據(jù)挖掘常用方法

 

功能挖掘法


雖然我們進(jìn)行了表達(dá)量的挖掘,但是每個基因在生物過程中都具有它們獨(dú)特的功能,僅關(guān)注表達(dá)量的信息,會讓我們漏掉非常多的信息。因此我們不能局限于表達(dá)量挖掘,而忽略了基因的功能。數(shù)據(jù)的挖掘除了我們常用表達(dá)量四大利器之外,還離不開我們的功能三大利器——注釋信息、GO富集分析、KEGG富集分析。


1.注釋信息


注釋信息,是我們數(shù)據(jù)挖掘中的長劍,所有的基因都會有它自己特殊的功能,通過注釋的方法能幫助我們將基因外層厚厚的謎團(tuán)破開。選擇不同的數(shù)據(jù)庫進(jìn)行注釋就是從不同的角度將基因的功能挖掘出來,我們可以合理的利用這些注釋信息來尋找我們的目標(biāo)基因。舉個例子,如果我們研究的目標(biāo)是病原侵染宿主的機(jī)制時,那么這個時候,PHI數(shù)據(jù)庫和植物R基因數(shù)據(jù)PRGdb就是幫助我們解開謎團(tuán)的利劍。


PHI數(shù)據(jù)庫,是專門收集病原宿主互作基因的數(shù)據(jù)庫,研究的對象主要是真菌、卵菌和細(xì)菌病原,即病原的信息,通過PHI數(shù)據(jù)庫的注釋,可以快速的幫我們找到,侵染過程中在病原內(nèi)起作用的關(guān)鍵基因。


而R基因是植物的抗病基因,病原入侵時會在植物體內(nèi)繁殖或擴(kuò)張,為了應(yīng)對病原的入侵,植物就會請出R基因來幫忙識別病原所產(chǎn)生的效應(yīng)蛋白,阻止病原菌的擴(kuò)散。通過植物R基因數(shù)據(jù)庫PRGdb就可以幫助我們將植物體內(nèi)的R基因找出來。


綜上所述,將PHI數(shù)據(jù)庫和PRGdb數(shù)據(jù)庫聯(lián)合使用,就可以快速的幫助我們定位病原宿主互作過程中的目標(biāo)基因,簡單又高效,是不是很優(yōu)秀呢~


當(dāng)然,研究的目標(biāo)不同,可以用到的數(shù)據(jù)庫也就不同,為了方便廣大科研人員,其實(shí)已經(jīng)有非常非常多的數(shù)據(jù)庫可以針對特定的目標(biāo)進(jìn)行分析,后期我們會多多介紹常見的數(shù)據(jù)庫,幫助大家進(jìn)行數(shù)據(jù)挖掘。


圖2.PHI數(shù)據(jù)庫和PRGdb數(shù)據(jù)庫

 

2.GO/KEGG富集分析


除了注釋信息之外,我們還經(jīng)常會利用GO和KEGG富集分析來進(jìn)行數(shù)據(jù)挖掘,他們倆是可以說是我們聽得最多的98k,在文章分析的時候,受到廣大學(xué)者的喜愛。通常與高通量測序相關(guān)的文章,我們都能看到他們倆的身影。


為什么富集分析會這么廣泛的使用呢?原因也比較簡單,基因的注釋雖然重要,但是當(dāng)我們面對成百上千的差異基因or目標(biāo)基因集時,信息非常零碎,利劍就難以一一將基因的謎團(tuán)破除,我們就需要對這些基因進(jìn)行歸類,而歸類的這個過程,就是富集分析。


富集分析的作用,一方面是對零散的基因功能信息進(jìn)行歸類,幫助我們找到下一步研究的方法,而另一方面就是產(chǎn)生一些美觀的圖表了,一篇文章,如果沒有幾張鎮(zhèn)得住場面的圖形,那很難入得了審稿人的法眼的。


富集分析的思路,就是研究差異的基因顯著富集在哪些通路之中。富集分析的研究方法同樣有兩種,一種就是直接對富集顯著的通路開展討論和分析,既然這些通路會被顯著富集,說明它們肯定在差異中起到了重要的作用,那么研究它們,肯定沒有錯。


此外,有些不顯著的通路,但是明顯就是與我們研究相關(guān),我們也是可以進(jìn)行討論,比如“Plant Hormone Signal transduction pathway”,當(dāng)我們研究的課題是植物激素相關(guān)時,這個通路我們肯定要討論一下了。至于為什么,大家可以看一下周老師的解釋(鏈接戳這里),有詳細(xì)的介紹原因,在這里,我們就不再贅述了。


圖3.GO富集調(diào)控圖(左),KEGG富集氣泡圖(右)

 

尋找“明星”


1.已有文獻(xiàn)報道的“明星”基因or通路


介紹完了表達(dá)量挖掘法和功能挖掘法,可能大家會覺得還是比較難下手,需要我們一步步的進(jìn)行挖掘,其實(shí)還有一些捷徑可以走,那就是——尋找“明星”。


我們在做某個方向的研究時,往往已經(jīng)有很多前人幫我們鋪好了路,需要研究哪些基因、通路,都已經(jīng)在文章中做了許多探討和研究。而我們可以做的,就是盡量的多收集相關(guān)的文獻(xiàn)。比如我們研究的是細(xì)胞自噬,那么就去搜索與細(xì)胞自噬相關(guān)的文章,將搜出來相關(guān)的文獻(xiàn)進(jìn)行匯總,發(fā)現(xiàn)原來PI3K/Akt/mTOR通路大家都會討論進(jìn)行討論,那么毫無疑問的,我們下手就對了。


盡管文獻(xiàn)的搜索和閱讀會花費(fèi)不少的時間,但正所謂磨刀不誤砍柴工,提前多花些時間進(jìn)行調(diào)研,我們在寫文章時就不會盲人摸象,毫無頭緒了。


圖4.醫(yī)學(xué)機(jī)制研究中的“明星”

 

2.某些特定的基因


除了尋找明星分子,其實(shí)我們還可以去尋找些特定的基因進(jìn)行研究,比如轉(zhuǎn)錄因子,激酶/磷酸酶,等等。這類基因通常具有特定的功能,在轉(zhuǎn)錄調(diào)控過程中起到重要的作用,也常常在文章中進(jìn)行討論,或者整個文章就是圍繞著這些特定的基因展開分析。針對這些特殊的基因,也是幫助我們進(jìn)行數(shù)據(jù)挖掘的好幫手。


圖5.轉(zhuǎn)錄因子分類統(tǒng)計圖

 

介紹了這么多,相信大家對數(shù)據(jù)挖掘的這些秘密武器有大致的了解了。在實(shí)際的數(shù)據(jù)挖掘中,我們可以將表達(dá)量、功能和尋找“明星”這三種利器相互結(jié)合進(jìn)行使用,如富集分析中尋找關(guān)心的通路,其實(shí)就是將功能挖掘與“明星”通路兩種利器強(qiáng)強(qiáng)聯(lián)手,快速定位目標(biāo)通路。


大家可以盡可能的進(jìn)行嘗試,挖掘想要的結(jié)果。如果還有更多的疑問,可以聯(lián)系基迪奧生物,我們會專門針對你的問題進(jìn)行答疑解惑哦~那么,我們下期再見啦~

    本站是提供個人知識管理的網(wǎng)絡(luò)存儲空間,所有內(nèi)容均由用戶發(fā)布,不代表本站觀點(diǎn)。請注意甄別內(nèi)容中的聯(lián)系方式、誘導(dǎo)購買等信息,謹(jǐn)防詐騙。如發(fā)現(xiàn)有害或侵權(quán)內(nèi)容,請點(diǎn)擊一鍵舉報。
    轉(zhuǎn)藏 分享 獻(xiàn)花(0

    0條評論

    發(fā)表

    請遵守用戶 評論公約

    類似文章 更多