RNA測序相信大家已經(jīng)接觸到不少了,它的樣品通常來自研究某一組織細(xì)胞群。這些細(xì)胞被認(rèn)為是同質(zhì)的,也就是說每一個細(xì)胞內(nèi)的表達(dá)水平被認(rèn)為是相似的。但事實(shí)上細(xì)胞之間的異質(zhì)性的很普遍的,RNA測序最終將表達(dá)量值算作所有細(xì)胞表達(dá)量的平均值,其實(shí)是掩蓋了細(xì)胞間差異的信號。而單細(xì)胞RNA測序就可以去發(fā)現(xiàn)細(xì)胞亞群中不同基因型和表型,或者不同的功能細(xì)胞之間的異質(zhì)性。 單細(xì)胞RNA測序主要在免疫學(xué)、癌癥和發(fā)育研究中使用。這個技術(shù)可以讓我們更全面的了解組織學(xué)上相似的細(xì)胞如何分化、發(fā)現(xiàn)新的細(xì)胞類型和狀態(tài)。而且在個性化醫(yī)療癌細(xì)胞靶點(diǎn)鑒定中有很好的應(yīng)用前景。單細(xì)胞RNA測序現(xiàn)在是一個非常熱門的技術(shù),有著廣泛的應(yīng)用。當(dāng)然為這個新技術(shù)開發(fā)得生物信息學(xué)工具也越來越多。 OMICtools已經(jīng)為我們選出了目前最受歡迎的單細(xì)胞RNA測序數(shù)據(jù)分析工具。(值得一提的是,OMICtools是一個非常有用的了解組學(xué)分析使用軟件的網(wǎng)站,有針對基因組、群體遺傳、RNAseq等各種分析的介紹。) Seurat和Monocle并列第一,47%的人投給了它們。 Seurat 是一個可以做單細(xì)胞RNA測序數(shù)據(jù)質(zhì)量控制、數(shù)據(jù)分析和數(shù)據(jù)挖掘的R包。算法包括非監(jiān)督聚類和預(yù)測細(xì)胞類型、單細(xì)胞數(shù)據(jù)空間重建以及不同處理,技術(shù)和跨物種的整合分析,還可以鑒定稀有細(xì)胞亞型。Seurat最有用的一點(diǎn)就是整合數(shù)據(jù)分析,它可以利用來自不同測序技術(shù)、不同物種和不同處理的數(shù)據(jù)中共同的變異來進(jìn)行下游的差異分析。 Monocle 是另一個比較成熟的軟件包,它提出了一個在擬時間(pseudotime)上對單細(xì)胞進(jìn)行排序的策略,利用生物過程中單個細(xì)胞之間并不同步的表達(dá)狀態(tài)來還原這個生物過程的細(xì)胞軌跡。Monocle運(yùn)用高階的機(jī)器學(xué)習(xí)技術(shù)(Reversed Graph Embedding)來準(zhǔn)確的對生物過程中的細(xì)胞進(jìn)行排序。Monocle也可以利于t-SNE等降維的方法來進(jìn)行聚類,然后發(fā)現(xiàn)差異表達(dá)基因。 TSCAN 和 RCA并列第二,同時獲得了43%的投票 TSCAN 也是一款基于細(xì)胞轉(zhuǎn)錄組漸變進(jìn)行擬時間(pseudo-temporal)排序的工具。TSCAN利用基于聚類的最小生成樹(minimum spanning tree,MST)算法來排序,首先對細(xì)胞進(jìn)行聚類然后利用MST算法來連接每個亞群的中心。然后將每個細(xì)胞對應(yīng)到樹上,排序后的過程軌跡就可以用來研究基因表達(dá)的動態(tài)變化。在構(gòu)建最小生成樹之前先進(jìn)行聚類減少數(shù)的空間復(fù)雜度,能夠更好的進(jìn)行細(xì)胞排序。TSCAN還有圖形界面版本,支持?jǐn)?shù)據(jù)可視化和用戶交互。你可以從Bioconductor中獲得,也可以使用Web版(https://zhiji./TSCAN/ )。 RCA(Reference Component Analysis)參考成分分析,這個算法作為一個R 包用于對單細(xì)胞RNA測序數(shù)據(jù)進(jìn)行聚類。RCA是目前已知的最好的單細(xì)胞轉(zhuǎn)錄組聚類方法,它所得到的聚類結(jié)果十分緊密,每個細(xì)胞簇幾乎完全有同一類型細(xì)胞組成。RCA還發(fā)現(xiàn)了直腸癌腫瘤魚正常粘膜中的多種細(xì)胞類型,要知道臨床樣品通常有非常強(qiáng)的批次效應(yīng)。RCA能對人類的單細(xì)胞RNA測序樣品進(jìn)行聚類分析,包括三種模式: 1. GlobalPanel: 全局模式,默認(rèn)選項(xiàng)用于分析各類細(xì)胞; 2. ColonEpitheliumPanel: 適合分析人類腸道樣品; 3. SelfProjection:適用于分析不太明確的組織樣品,這個模式還在繼續(xù)優(yōu)化中。 第三名:Wishbone(python 3 ) Wishbone利用分叉樹(bifurcating branches)來識別單細(xì)胞的發(fā)育軌跡,首先支出分叉點(diǎn),然后根據(jù)細(xì)胞的發(fā)育進(jìn)度將每個細(xì)胞標(biāo)記為分叉前(pre-bifurcation)或者兩個不同細(xì)胞命運(yùn)里的其中一個分叉后(post-bifurcation)的支上,從而完成排序。這個方法還被應(yīng)用在研究小鼠骨髓細(xì)胞分化上。Wishbone可以分析各種測序技術(shù)得到的單細(xì)胞RNA測序數(shù)據(jù),如單細(xì)胞質(zhì)譜流式(Mass Ctyometry)和單細(xì)胞RNA測序。 相關(guān)軟件鏈接: 1. Seurat:https://cran./web/packages/Seurat/index.html 2. Monocle:https:///packages/release/bioc/html/monocle.html 3. TSCAN:http:///packages/release/bioc/html/TSCAN.html 4. Web在線分析:https://zhiji./TSCAN/ 5. Youtube Demo 演示:https://www./watch?v=zdcBAVe1GBE 6. RCA:https://github.com/GIS-SP-Group/RCA 7. Wishbone:https://github.com/ManuSetty/wishbone |
|