日韩黑丝制服一区视频播放|日韩欧美人妻丝袜视频在线观看|九九影院一级蜜桃|亚洲中文在线导航|青草草视频在线观看|婷婷五月色伊人网站|日本一区二区在线|国产AV一二三四区毛片|正在播放久草视频|亚洲色图精品一区

分享

手把手教你單基因分析如何從1做到8

 阿非ycfg 2021-04-24
從目前發(fā)表的許多文章來看,做單基因純生信分析的思路大多是迎合已經(jīng)發(fā)表的大型研究,很難單獨(dú)依靠挖掘公共數(shù)據(jù)庫而發(fā)現(xiàn)一個(gè)功能強(qiáng)大的新基因,主要原因有兩個(gè):
1.在腫瘤研究中,功能強(qiáng)大的基因很多早就已經(jīng)被研究過了,比如P53,在上個(gè)世紀(jì)就已經(jīng)研究的很透徹了,所以未曾見過現(xiàn)在還有用單獨(dú)用P53這個(gè)基因來做純生信分析的(當(dāng)然不能排除P53和別的基因聯(lián)合分析);
2.如今純生信數(shù)據(jù)挖掘不像最開始那幾年隨便挖一個(gè)表型都能發(fā)一篇文章,現(xiàn)在水漲船高,如果你挖掘到一個(gè)未曾報(bào)道的功能強(qiáng)大的基因,編輯第一反應(yīng)就是這個(gè)表型是否可靠,第二反應(yīng)就是讓你拿實(shí)驗(yàn)進(jìn)行驗(yàn)證。
所以,做單基因純生信最好的打開方式就是閱讀最新的文獻(xiàn),尤其是單細(xì)胞轉(zhuǎn)錄組的文章,它們會在單個(gè)細(xì)胞水平上發(fā)現(xiàn)很多備選基因,而由于篇幅的限制,不能把每個(gè)基因都研究一遍,而大家就可以從中挑選幾個(gè)備選基因進(jìn)行分析,這樣既能打消編輯的懷疑,又能通過數(shù)據(jù)挖掘發(fā)現(xiàn)新的表型;還有一種方法是看最新報(bào)道的功能強(qiáng)大的基因,然后換一種癌型進(jìn)行分析,因?yàn)槿祟惏┌Y的異質(zhì)性很大,同樣的基因在不同腫瘤中可能參與不同的功能通路,然后可以進(jìn)行類比,搬運(yùn)到別的腫瘤中進(jìn)行分析,言之有理即可。
同時(shí)還有一個(gè)技巧是,如果對所研究癌型沒有要求的話,可以著重研究比較罕見的腫瘤,比如下面這篇今年剛發(fā)表在BioMed Research International(IF:2.3)雜志上的單基因純生信文章:
Image
就是對COL1A1在間皮瘤中的表型進(jìn)行分析,而且沒有使用任何代碼。其實(shí)有關(guān)COL1A1這個(gè)基因在腫瘤中研究已經(jīng)很多了,小編隨便搜了兩篇:
Image
Image
但是這篇之所以能發(fā)表,首先是因?yàn)閷OL1A1在間皮瘤中的表型進(jìn)行分析,因?yàn)殚g皮瘤很罕見,從而具有較強(qiáng)的新穎性;當(dāng)然這篇文章還有另一點(diǎn)可取之處是它的分析角度是腫瘤免疫浸潤。一般編輯為了增加引用率都是會比較偏向接收熱點(diǎn)研究的文章,而腫瘤免疫浸潤正是這幾年的熱點(diǎn)之一,其余的熱點(diǎn)方向還包括腫瘤代謝研究,腫瘤的表觀修飾(m6A)研究等。
鑒于小編是腫瘤免疫學(xué)背景,下面就示范一個(gè)單基因腫瘤浸潤分析的文章。為了方便大家理解,小編還拿間皮瘤做示范。
基礎(chǔ)分析(1-3分)
第一步:挑基因
按照正常的邏輯是應(yīng)該先看這個(gè)基因在間皮瘤和正常組織的表達(dá)情況,然后才是分析它的表型,如對生存的影響,或者是對各種免疫細(xì)胞浸潤的影響。最后是解釋為何產(chǎn)生這種影響,而小編今天要演示的恰恰相反。大家必須先認(rèn)識到,既然做單基因的生信分析,那么挑出一個(gè)好的基因?qū)⒅苯佑绊懙阶罱K結(jié)果的好壞,因此必須將重點(diǎn)放在挑選基因上。
就比如我們想研究某個(gè)基因?qū)﹂g皮瘤免疫細(xì)胞浸潤(表型1)的影響來影響患者生存(表型2),當(dāng)然可以直接挑選出影響間皮瘤生存最顯著的基因來一個(gè)個(gè)看是否影響免疫浸潤,但這樣工作量會比較大。我們其實(shí)可以通過將最影響生存的基因和免疫相關(guān)基因取交集的方式先縮小這個(gè)范圍。
關(guān)于免疫基因數(shù)據(jù)庫有很多,小編給大家推薦的是IMMPORT(https://www./home)這個(gè)數(shù)據(jù)庫,它整理了2498個(gè)免疫相關(guān)基因,可以直接在網(wǎng)站下載。另一個(gè)需要準(zhǔn)備的就是挑選出最影響間皮瘤患者生存的基因,這個(gè)有代碼能力的可以自己寫代碼,而小編今天帶領(lǐng)大家直接使用別人整理好的數(shù)據(jù),需要借用在線工具。這種工具有很多,小編給大家推薦的就是一款國產(chǎn)工具:GEPIA2(http://gepia2./#index)。可以通過以下界面進(jìn)行挑選出最影響間皮瘤患者生存的基因并下載。
Image
GEPIA2對每種癌型都是默認(rèn)給出500個(gè)最影響患者生存的基因,可以通過將這些基因和免疫基因取交集來縮小范圍。這一步可通過在線工具(http://bioinformatics.psb./webtools/Venn/)做VENN圖。:
Image
小編挑選了一部分免疫基因做的交集,得到17個(gè)備選基因,下面就用第二個(gè)基因OXTR來進(jìn)行后續(xù)演示。
第二步:找表型
既然是挑選出的最影響間皮瘤患者生存的基因(大家可以自己測試一下),那已經(jīng)擁有了一個(gè)表型。但做單基因生信分析,只有一個(gè)表型往往是不夠的,下面就帶大家找下一個(gè)表型。
免疫相關(guān)基因或多或少會和免疫調(diào)控扯上點(diǎn)關(guān)系,而免疫細(xì)胞浸潤程度和這些基因也可能存在多種潛在關(guān)聯(lián)。因此,如果OXTR可以影響間皮瘤患者免疫細(xì)胞的浸潤,我們就可以說OXTR可能是通過影響某一種或某幾種免疫細(xì)胞的浸潤來影響患者生存,從而完成一個(gè)內(nèi)容比較豐富的文章。
研究免疫浸潤的算法有很多了,如CIBERSORT, Xcell, TIMER等,今天小編帶大家使用的是TIMER的升級版:TIMER2(http://timer./).這款軟件在前一個(gè)版本上增加了許多新功能,而且整合了多種腫瘤免疫浸潤分析算法得到的結(jié)果,因而更加方便我們使用。
如下所示,首先進(jìn)入Immune-Gene板塊下,我們可以在腫瘤類型中選擇MESO(間皮瘤),symbol中輸入OXTR,接下來選擇各種免疫細(xì)胞。下面技巧來了,因?yàn)樾【幾约簻y試過OXTR這個(gè)基因是促癌基因(高表達(dá)OXTR的患者存活時(shí)間短),因此這里就挑選出幾種促進(jìn)腫瘤生長的免疫細(xì)胞進(jìn)行分析,如Treg, MDSC等。如果你挑選出的是保護(hù)基因,就需要挑選有抗腫瘤潛力的免疫細(xì)胞,如CD8+ T細(xì)胞,DC等,我是建議大家盡量挑選出促癌基因進(jìn)行分析,因?yàn)楹罄m(xù)如果做實(shí)驗(yàn)驗(yàn)證,比較容易做出陽性結(jié)果,如做遷徙,增值實(shí)驗(yàn)等。
Image
從結(jié)果中我們可以看到OXTR對MESO患者的MDSC浸潤影響較大(標(biāo)紅的是有統(tǒng)計(jì)學(xué)差異的,可以通過點(diǎn)擊進(jìn)行查看),因此后續(xù)就可以針對OXTR通過影響MESO患者的MDSC浸潤程度來影響生存。其實(shí)到這里就已經(jīng)可以進(jìn)行寫作了,為了驗(yàn)證以上猜想,還可以利用TIMER2進(jìn)行下面分析
還是上面的設(shè)置,切換到Immune-Outcome板塊下,我們就能分析各種腫瘤浸潤的免疫細(xì)胞對患者生存的影響:
Image
同樣,你沒有看錯(cuò),也不是巧合,MDSC的浸潤水平就是會影響MESO患者的生存,點(diǎn)開后發(fā)現(xiàn),OXTR的表達(dá)會影響MESO患者M(jìn)DSC的浸潤水平。
Image
第三步:探索機(jī)制
上面已經(jīng)找到了我們所需要的表型,下面就需要解釋是什么OXTR可能通過什么樣的機(jī)制來影響MESO患者的MDSC浸潤水平,或者說是OXTR如何參與MDSC的腫瘤浸潤過程。
其實(shí)很容易可以想到的就是根據(jù)OXTR在MESO患者中的表達(dá)情況,找出表達(dá)最相關(guān)的基因(根據(jù)需要設(shè)定閾值),然后通過GO和KEGG等已知的功能通路去注釋。其實(shí)除了這兩個(gè)比較重要的基因集外還有很多,比如REACTOM,C8(免疫專用)等,而小編接下來為大家介紹的同樣是一款在線工具,而它盡可能整合了所有的基因富集分析數(shù)據(jù)庫。這個(gè)在線工具就是就是 WebGestalt(http://www./),界面如下:
Image
可以通過GEPIA2找出在MESO患者中和OXTR最相關(guān)的基因做ORA(GO,KEGG)分析,也可以根據(jù)OXTR在MESO患者中高低表達(dá)分成兩組做GSEA分析,然后找出和免疫細(xì)胞浸潤調(diào)控的通路進(jìn)行解釋就可以了,具體操作上述那篇文章都有詳細(xì)介紹,小編在這里就不贅述了。
最后,可以找出別的數(shù)據(jù)集進(jìn)行外部驗(yàn)證,如利用GEO數(shù)據(jù)庫的在線工具GEO2R(https://www.ncbi.nlm./geo/geo2r/)對其中MESO數(shù)據(jù)集進(jìn)行分析,看看OXTR在正常組織和腫瘤組織的表達(dá)情況,或者利用ONCOMINE(https://www./resource/login.html)數(shù)據(jù)庫也能完成對MESO患者的OXTR基因表達(dá)情況分析。到目前為止,我們已經(jīng)基本完成一個(gè)1-3分SCI論文的體量,小編之所以說是1-3分而不都是3分,是因?yàn)榇蠹铱赡苷业降氖遣煌幕颍@些基因在腫瘤中的研究情況不同,因此這是決定完成這種套路分析最后能發(fā)表的雜志水平。因此大家務(wù)必在挑基因上花費(fèi)很大功夫,來挑選出具有研究潛力的基因。但是挑出的基因不能太新,比如我們研究的是影響腫瘤患者免疫浸潤的基因,如果沒有研究報(bào)道過這個(gè)基因的對免疫細(xì)胞浸潤有作用,那編輯肯定會懷疑它的準(zhǔn)確性。同時(shí)也不能太舊,如果一個(gè)基因已經(jīng)被研究的很透徹了,再做生信分析就沒有任何意義。所以,應(yīng)該權(quán)衡兩方面利弊,中庸之道乃為王道。
進(jìn)階分析(4-10分)
以上是為了滿足大多數(shù)科研工作者的套路,是沒有做實(shí)驗(yàn)?zāi)芰Φ囊恍┤硕?strong>不需要使用任何代碼所需掌握的套路??紤]到有一些人還是有比較好的實(shí)驗(yàn)條件的,此外,還有一些人是具備代碼能力的,因此小編接下來就將介紹更高階的生信分析套路。
1.聯(lián)合單細(xì)胞數(shù)據(jù)分析
基礎(chǔ)分析部分都是基于bulk-seq的測序數(shù)據(jù),這些數(shù)據(jù)都是平均化后的,掩蓋了很多在特殊細(xì)胞上高表達(dá)的基因。而解決這個(gè)問題的技術(shù)已經(jīng)出現(xiàn),那就是單細(xì)胞測序技術(shù)。上面有說過近些年單細(xì)胞測序技術(shù)產(chǎn)生了大量數(shù)據(jù),這些數(shù)據(jù)很多都已經(jīng)公開,會代碼的同志們可以通過對數(shù)據(jù)庫下載下來的單細(xì)胞數(shù)據(jù)進(jìn)行分析。比如,上述檢測到OXTR在MESO患者中可能影響MDSC的浸潤,那么肯定不是所有的細(xì)胞MESO中都高表達(dá)OXTR,那么通過分析單細(xì)胞測序技術(shù)我們就可以準(zhǔn)確推斷出是在哪一種細(xì)胞中高表達(dá),假設(shè)MESO的上皮細(xì)胞高表達(dá)OXTR,那么就可以進(jìn)一步推測可能是MESO患者腫瘤中上皮細(xì)胞高表達(dá)OXTR從而趨化MDSC的浸潤。這樣就增加了研究的深度,提高文章的檔次。這種套路根據(jù)分析結(jié)果可以達(dá)到4-6分水平。
但值得一提的是,MESO因?yàn)楸容^罕見,現(xiàn)在可能沒有針對該腫瘤的單細(xì)胞數(shù)據(jù),在分析之前需要先搜索一下目前是否已經(jīng)有想要研究的癌癥的單細(xì)胞數(shù)據(jù)。
3.實(shí)驗(yàn)驗(yàn)證
另一個(gè)思路就是可以通過實(shí)驗(yàn)驗(yàn)證來增加文章研究的深度。如一項(xiàng)在黑色素瘤中研究的某個(gè)基因影響CD8+T細(xì)胞免疫浸潤水平,就可以在小鼠B16細(xì)胞系中通過RNAsi構(gòu)建低表達(dá)這個(gè)基因的腫瘤細(xì)胞系,和對照組分別皮下接種給小鼠,觀察兩組腫瘤生長的趨勢,最后可以通過酶解法提取出TILS進(jìn)行流式染色。如果通過干擾這個(gè)基因的表達(dá)可以影響CD8+T細(xì)胞腫瘤浸潤的比例,就可以證實(shí)我們的猜想,另外還可以檢測CD8+T細(xì)胞的功能分子和標(biāo)志基因的表達(dá)情況。這種套路根據(jù)實(shí)驗(yàn)結(jié)果可以達(dá)到5-8分的水平。
3.聯(lián)合分析
看到這個(gè)題目大家就可以想到,可以結(jié)合上述兩步,從單細(xì)胞數(shù)據(jù)庫中提取到的候選基因通過實(shí)驗(yàn)進(jìn)行驗(yàn)證,這種套路就可以完成一項(xiàng)8+甚至10分的水平。此外,還可以通過自行收集臨床腫瘤樣本進(jìn)行基本的qPCR, IHC等實(shí)驗(yàn)驗(yàn)證,都可以增加文章的研究深度。如有條件,還可以通過搜集所工作的醫(yī)院幾十例(甚至上百例)臨床樣本自行測序,來和數(shù)據(jù)庫挖掘的結(jié)果互相驗(yàn)證,這會使編輯覺得分析結(jié)果更加可信。
套路千百條,條條都可以走進(jìn)編輯的心。只要本著不斷探索的初心,就一定會發(fā)現(xiàn)新的思路,但是萬萬不可造假,這樣禍害的不僅是個(gè)人,還是生信分析整個(gè)領(lǐng)域,希望此文能達(dá)到一個(gè)拋磚引玉的效果,歡迎有新想法或者想實(shí)現(xiàn)新的生信分析思路的科研工作者和我們生信人團(tuán)隊(duì)聯(lián)系。

    本站是提供個(gè)人知識管理的網(wǎng)絡(luò)存儲空間,所有內(nèi)容均由用戶發(fā)布,不代表本站觀點(diǎn)。請注意甄別內(nèi)容中的聯(lián)系方式、誘導(dǎo)購買等信息,謹(jǐn)防詐騙。如發(fā)現(xiàn)有害或侵權(quán)內(nèi)容,請點(diǎn)擊一鍵舉報(bào)。
    轉(zhuǎn)藏 分享 獻(xiàn)花(0

    0條評論

    發(fā)表

    請遵守用戶 評論公約

    類似文章 更多