解讀文獻(xiàn)題目:
TCGA based integrated genomic analyses of ceRNA network and novel subtypes revealing potential biomarkers for the prognosis and target therapy of tongue squamous cell carcinoma
這是一篇2019年發(fā)表在plos one 的純生信文章。
摘要 目的
該研究旨在研究舌鱗狀細(xì)胞癌(TSCC)生物學(xué)發(fā)展中的ceRNA網(wǎng)絡(luò),通過使用基于癌癥基因組圖譜(TCGA)的整合基因組分析來鑒定TSCC的新分子亞型,以篩選靶向治療和預(yù)后的潛在生物標(biāo)志物。數(shù)據(jù)庫。 材料與方法
從TCGA和GEO數(shù)據(jù)庫下載基因表達(dá)數(shù)據(jù)。差異表達(dá)的RNA(DERNAs)由R中的DESeq2來定義。功能富集分析使用R中的聚集體進(jìn)行.PPI網(wǎng)絡(luò)通過參考String網(wǎng)站建立。通過R中的survival包進(jìn)行DERNA的生存相關(guān)分析。從Starbase v3.0數(shù)據(jù)框獲得mRNA,miRNA和lncRNA之間的相互作用并構(gòu)建ceRNA網(wǎng)絡(luò)。 Consensus Cluster Plus軟件包用于識別分子亞型。通過將它們與GEO微陣列數(shù)據(jù)進(jìn)行比較來驗證所有關(guān)鍵基因。使用SPSS 22.0對不同亞型的臨床特征進(jìn)行統(tǒng)計分析。 結(jié)果
從腫瘤和正常組織中鑒定出總共2907個mRNA(1366個上調(diào)和1541個下調(diào)),191個miRNA(98個上調(diào)和93個下調(diào))和1831個lncRNA(1151個上調(diào)和680個下調(diào)) ?;谏鲜龅牟町怰NA成功構(gòu)建了ceRNA網(wǎng)絡(luò),并使用了15個DEmRNA,1個DEmiRNA,2個與預(yù)后相關(guān)的DElncRNA。 結(jié)論
該研究構(gòu)建了一個ceRNA網(wǎng)絡(luò)并鑒定了TSCC的分子亞型,我們的研究結(jié)果為這種難治性癌癥潛在的治療靶點和預(yù)后指標(biāo)提供了新的標(biāo)志物。 方法和材料 1.數(shù)據(jù)收集和預(yù)處理
從TCGA數(shù)據(jù)庫(https://portal.gdc./ )獲得TSCC的基因表達(dá)數(shù)據(jù)(lncRNA、mRNA和miRNA表達(dá)譜數(shù)據(jù))和相應(yīng)的TSCC臨床數(shù)據(jù),收集126個TSCC樣品和13個正常對照樣品。在這些數(shù)據(jù)中,mRNA和lncRNA表達(dá)數(shù)據(jù)是基于Illumina HiSeqRNASeq平臺獲得的,而miRNA數(shù)據(jù)是從Illumina HiSeqmiRNASeq平臺收集的。 首先對TCGA的RNA表達(dá)預(yù)處理,篩選掉其中的低表達(dá)基因(count<10)進(jìn)行預(yù)處理。根據(jù)GENCODE Release 29(GRCh38.p12)(https://www./human/ )注釋mRNA和lncRNA。 而miRNA是基于miRbase v22數(shù)據(jù)庫(http://www./index.shtml#opennewwindow )進(jìn)行注釋。
通過搜索“舌鱗狀細(xì)胞癌”,從Gene Omnibus(GEO)數(shù)據(jù)庫(http://www.ncbi.nlm./geo/ )下載TSCC(GSE30784,GSE13601和GSE28100)的3個基因表達(dá)譜。 “(2019年1月)?;贏ffymetrix Human Genome U133 Plus 2.0 Array和U95 Version 2 Array確定GSE30784和GSE13601。 GSE28100的平臺是Agilent-021827人miRNA微陣列(V3)(miRBase釋放12.0 miRNA ID版本)。
2.鑒定TSCC中差異表達(dá)的mRNA,miRNA和lncRNA
使用R軟件的DESeq2包鑒定TSCC樣品和正常對照樣品中差異表達(dá)的lncRNA(DElncRNA),mRNA(DEmRNA),miRNA(DEmiRNA)。將P值設(shè)置為FDR, | log2(FC)| > 1.5且P值<0.05被設(shè)定為差異基因的閾值。隨后根據(jù)R的pheatmap包繪制熱圖。 GO注釋和KEGG途徑的功能富集分析
R的ClusterProfiler v3.8包用于分析和可視化基因的功能譜(基因本體論(GO)注釋和京都基因和基因組百科全書(KEGG)途徑)以確定DEmRNA之間的共享功能。 P <0.05被認(rèn)為是GO和KEGG富集分析的閾值。 4.建立蛋白質(zhì) - 蛋白質(zhì)相互作用(PPI)網(wǎng)絡(luò)
為了理解DEmRNA的潛在相互作用,STRING網(wǎng)站被用于構(gòu)建PPI網(wǎng)絡(luò),該網(wǎng)絡(luò)由Cytoscape軟件可視化。 5.與預(yù)后相關(guān)的DEmRNA,DElncRNA和DEmiRNA
通過使用R的survival包進(jìn)行生存分析以評估差異表達(dá)的RNA在TSCC患者中的預(yù)后價值。根據(jù)每一個DEmRNA,DElncRNA和DEmiRNA的各自表達(dá)量數(shù)據(jù),將所有樣品分成高表達(dá)組(大于中位數(shù))或低表達(dá)組(小于中位數(shù))。使用Kaplan-Meier方法繪制生存曲線。采用對數(shù)秩檢驗來評估統(tǒng)計學(xué)顯著性。 P <0.05被認(rèn)為具有統(tǒng)計學(xué)意義。 6.預(yù)測lncRNA-miRNA和miRNA-mRNA相互作用
我們通過使用starBase數(shù)據(jù)庫預(yù)測DElncRNA和DEmiRNA或DEmRNA和DEmiRNA之間的相互作用,starBase記錄了來自許多個測序數(shù)據(jù)的超過110萬個miRNA-ncRNA,250萬個miRNA-mRNA和150萬個RNA-RNA相互作用。此外,starBase整合了來自miRanda,Targerscan和miRmap數(shù)據(jù)庫的預(yù)測結(jié)果。只有被記錄為負(fù)向相關(guān)關(guān)系的DEmiRNA和DEGs,DElncRNAs和DEmiRNAs被包括在ceRNA網(wǎng)絡(luò)中。 7.構(gòu)建ceRNAs網(wǎng)絡(luò)
根據(jù)ceRNA理論,使用Cytoscape軟件v3.6.1整合DEmiRNA和DEmRNA以及DE1ncRNA和DEmiRNA的選擇的相互作用以構(gòu)建DElncRNAs-DEmiRNAs-DEmRNAs ceRNA網(wǎng)絡(luò)。 結(jié)果 TSCC中的DElncRNA,DEmiRNA和DEmRNA 總共鑒定出總共2907個差異表達(dá)的mRNA(1366個上調(diào)和1541個下調(diào)),191個miRNA(98個上調(diào)和93個下調(diào))和1831個差異表達(dá)的lncRNA(1151個上調(diào)和680個下調(diào))。 miRNAseq數(shù)據(jù)| log2(FC)|> 1.5和P值<0.05。 具有差異表達(dá)的RNA在熱圖中可視化(圖1)。 表1中列出了前10個DElncRNA,DEmiRNA和DEmRNA。