2019-04-25 今天介紹的依舊是國貨——GEPIA。中文:基因表達譜數據動態(tài)分析 英文:Gene Expression Profiling Interactive Analysis TCGA應該不用過多介紹了,癌癥和腫瘤基因圖譜計劃,包含了最全面的測序數據。CEPIA平臺對TCGA數據的分析足以滿足大部分普通科研人民的日??蒲行枨罅恕?/p> 網址:http://gepia./ 打開首頁: 快速啟動: 在“輸入基因名稱”字段中輸入一個基因符號或基因ID(Ensembl ID),然后單擊“GoPIA!”按鈕搜索感興趣的基因。 微分表達式分析 該特性允許用戶在給定的數據集上應用自定義統(tǒng)計方法和閾值來動態(tài)獲取差異表達的基因及其染色體分布。 參數 數據集:選擇感興趣的癌癥類型。 染色體分布 選擇“高表達”、“低表達”或“兩者”作為染色體分布圖。 微分法:選擇一種差異分析方法。 \x{e76f}日志 2 FC_截斷 設置自定義折疊-更改閾值。 Q值截止 設置自定義Q值閾值。 百分比截止 設置自定義百分比閾值。 對于方差分析(ANOVA)和LIMMA(LIMMA)選項,基因具有較高的比 2 FC值和低于預設閾值的Q值被認為是差異表達的基因. 在前10名中,對數較高的基因 2 FC值和高于閾值的百分比值被認為是過度表達的基因;因此,只有過表達的基因才會出現在列表和染色體圖中。 結果 差異基因 單擊“列表”按鈕:GEPIA將生成一個差異表達基因列表[默認情況下,該列表按日志的降序排列。 2 基于輸入參數。 染色體分布圖 點擊“繪圖”按鈕:GEPIA將生成染色體分布圖。染色體上高表達的基因用紅線標記,而低表達的基因被標記為綠色。 DIY表達 GEPIA根據選定的數據集和按癌癥類型或病理分期的統(tǒng)計方法繪制特定基因的表達譜。詳情如下: 基因表達譜 GEPIA在多個癌癥類型和配對正常樣本中產生點圖分析基因表達,每個點代表一個不同的腫瘤或正常樣本。 參數 基因 輸入感興趣的基因。 數據集/組織順序:在“DataSet”字段中選擇感興趣的癌癥類型,然后單擊“Add”或“All”,在“組織順序”字段中構建數據集列表。手動輸入由逗號劃分的癌癥類型(例如ACC、BRCA、BLCA)也是可以接受的。圖的x軸將遵循數據集的順序。 測井標尺:選擇使用線性還是日志 (TPM+1)轉換表達式數據進行繪圖。 匹配正常數據:在繪圖中,選擇“TCGA法線+GTEx法線”、“只有TCGA法線”或“None”作為匹配的正常數據。[用于微分分析的匹配正常樣本為“TCGA正常+GTEx正態(tài)”] 地塊寬度 設置自定義繪圖寬度。 微分法 統(tǒng)計方法用于差異基因表達分析。 \x{e76f}日志 2 FC_截斷 在前10名中,對數較高的基因 2 FC值和高于閾值的百分比值被認為是過度表達的基因. 結果 點擊“繪圖”按鈕:GEPIA將根據用戶的自定義輸入參數生成一個基因表達概要文件。 盒樣地 GEPIA生成帶有抖動的方框圖,用于比較幾種癌癥類型中的表達(為了獲得最佳的視覺質量,我們推薦1-4種癌癥類型)。 參數 基因 數據集選擇/數據集 ?。涸凇皵祿x擇”字段中選擇感興趣的癌癥類型,然后單擊“添加”在“DataSet”字段中生成數據集列表。手動輸入由逗號劃分的癌癥類型(例如ACC、BRCA、BLCA)也是可以接受的。圖的x軸將遵循數據集的順序。 腫瘤顏色:設置腫瘤數據集的框色。 正常顏色:設置普通數據集的框色。 抖動尺寸:設置整個框內抖動的大小。 差分閾值: \x{e76f}日志 2 FC_截斷 設置自定義折疊-更改閾值。 P值截止:設置自定義p值閾值。 匹配正常數據:選擇“TCGA法線+GTEx法線”、“只有TCGA法線”進行差異分析和繪圖。 這里的差異分析基于選定的數據集。 (“TCGA腫瘤與TCGA正常+GTEx正常”或“TCGA腫瘤與TCGA正?!?。差異分析的方法是單向方差分析,以疾病狀態(tài)(腫瘤或正常)作為變量計算差異表達: 表達式數據是第一個日志。 2 (TPM+1)變換用于微分分析和日志 2 FC被定義為中位(腫瘤)-中位數(正常)。 高log基因 2 FC值和低于預設閾值的Q值被認為是差異表達的基因. 結果 點擊“繪圖”按鈕:GEPIA將顯示一個基于用戶自定義輸入參數的基因表達框圖。 基于病理分期的剖面圖 這一特征根據病人的病理階段生成表達小提琴的情節(jié)。 參數 基因 數據集選擇/數據集:在“數據集選擇”字段中選擇一個或多個感興趣的癌癥類型,然后單擊“添加”以在“數據集”字段中生成數據集列表。手動輸入由逗號分割的癌癥類型(例如Coad、Read)也是可以接受的。 使用主要階段:選擇病理主要階段或亞階段進行繪圖。 情節(jié)色彩 在情節(jié)中設置小提琴的顏色。 差異基因表達分析方法為單向方差分析,以病理分期為變量計算差異表達: 表達式數據是第一個日志。 2 (TPM+1)轉換為微分分析。 注意:如果在某一階段只存在一個樣本,該樣本將被GEPIA過濾掉,以提高情節(jié)的視覺質量。 結果 點擊“繪圖”按鈕:GEPIA將生成一個基于用戶自定義輸入的基因表達階段圖。 多基因表達比較 此特性提供基于給定基因列表的表達矩陣圖。每個塊中的顏色密度表示一個基因在給定組織中的中位表達值,通過所有塊的最大中值表達值進行歸一化。同一腫瘤或正常組織中的不同基因可以在一個地方進行比較。 參數 基因表 輸入感興趣的基因列表。人工輸入逗號分裂的基因。 ERBB 2,EGFR)也是可以接受的。 數據集/組織順序:在“DataSet”字段中選擇感興趣的癌癥類型,然后單擊“Add”或“All”,在“組織順序”字段中構建數據集列表。此外,手動輸入由逗號劃分的癌癥類型(例如ACC、BRCA、BLCA)也是可以接受的。 匹配正常數據:選擇“只有TCGA腫瘤”、“TCGA腫瘤+TCGA正常+GTEx正?!被颉癟CGA腫瘤+TCGA正?!边M行繪圖。 結果 單擊“繪圖”按鈕:GEPIA將根據用戶自定義輸入參數生成表達式矩陣圖。 生存分析 GEPIA根據基因表達進行整體生存(OS)或無疾病生存(DFS,也稱為無復發(fā)生存和RFS)分析。GEPIA采用對數秩檢驗,即Mantel-Cox檢驗,用于假設檢驗.可以調整隊列閾值,也可以使用基因對。COX比例風險比和95%置信區(qū)間信息也可以包含在生存圖中。最與病人生存相關的基因可以被搜索。 參數 生存地塊 基因 基因歸一化 在“基因”領域設置用于正?;幕?。 方法:選擇OS或DFS生存方法。 軸心單位:選擇月份或日單位進行繪圖。 數據集選擇/數據集:在“數據集選擇”字段中選擇一個或多個感興趣的癌癥類型,然后單擊“添加”以在“數據集”字段中生成數據集列表。此外,手動輸入的癌癥類型劃分為逗號(例如Coad,讀)也是可以接受的。 顏色反轉選擇是否反轉默認顏色。 群截止:選擇一個合適的表達閾值來分割高表達和低表達的隊列。 截止-高(%):表達水平高于此閾值的樣本被認為是高表達群體. 截止-低(%) 表達水平低于此閾值的樣本被認為是低表達群體. 最重要的生存基因 數據集選擇:選擇感興趣的癌癥類型。 方法:選擇OS或DFS生存方法。 群截止:選擇合適的表達閾值來分割高表達和低表達的隊列。 結果 生存地塊 單擊“繪圖”按鈕:GEPIA將根據用戶自定義輸入參數生成生存圖。 最重要的生存基因 點擊“列表”按鈕:GEPIA將生成一個列表,列出在癌癥類型下最重要的100種存活基因。 相似基因檢測 這一功能識別了與輸入基因和所選數據集具有相似表達模式的基因列表。 參數 基因 頂#相似基因:列出最相似的基因。(最高限額:200) TCGA腫瘤/TCGA正常/GTEx/表達數據集:在“TCGA腫瘤”、“TCGA法線”或“GTEx”字段中選擇感興趣的癌癥類型,然后單擊“Add”在“二手表達式數據集”字段中構建數據集列表。此外,手動輸入由逗號分割的癌癥類型(例如Coad腫瘤、讀腫瘤)也是可以接受的。相似的基因是根據數據集列表來檢測的。 結果 點擊“列表”按鈕:GEPIA將生成一個由Pearson相關系數(PCC)排序的具有相似表達模式的基因列表。 相關性 該函數利用Pearson、Spearman和Kendall等方法對給定的TCGA和/或GTEx表達數據進行成對基因表達相關分析。一個基因可以被另一個基因規(guī)范化。 GEPIA使用非對數標度進行計算,并使用對數標度軸進行可視化。 參數 基因A 輸入感興趣的A基因。[x軸] B基因 輸入感興趣的B基因。[y軸] 基因歸一化 設置用于A和B基因正?;幕?。 相關系數 計算相關系數的方法。 TCGA腫瘤/TCGA正常/GTEx/表達數據集 ?。涸凇癟CGA腫瘤”、“TCGA法線”或“GTEx”字段中選擇感興趣的癌癥類型,然后單擊“Add”在“二手表達式數據集”字段中構建數據集列表。相關分析基于數據集列表。 結果 點擊“繪圖”按鈕:GEPIA將生成一個相關分析結果的散點圖。 降維 GEPIA使用自定義的TCGA和/或GTEx表達數據對給定的基因列表進行主成分分析(PCA)。首先,GEPIA給出了前三個主成分(PC)的三維圖,并為每臺PC解釋的差異生成一個條形圖。第二,GEPIA提供了基于用戶指定PC的2D或3D繪圖。 參數 第一步 基因表 輸入感興趣的基因列表。人工輸入逗號分裂的基因。 ERBB 2,EGFR )也是可以接受的。 比例尺 選擇是否使用Z分數代替表達水平作為PCA分析的輸入。 TCGA腫瘤/TCGA正常/GTEx/表達數據集:在“TCGA腫瘤”、“TCGA法線”或“GTEx”字段中選擇感興趣的癌癥類型,然后單擊“Add”在“二手表達式數據集”字段中構建數據集列表。主成分分析基于數據集列表。 第二步 PC選擇:為2D(設置x和y值)或3D散點圖(設置x、y和z值)選擇PC。 結果 第一步 單擊“列表”按鈕:GEPIA將根據相關分析結果生成三維散點圖和方差分布。 通過單擊右上角的照相機圖標,3D圖形可以保存為.png文件。 點擊“繪圖2D”按鈕:GEPIA將生成一個2D散點圖的相關分析結果。 點擊“繪圖3D”按鈕:GEPIA將生成3D散點圖的相關分析結果。 結果下載: 通過單擊結果附近的按鈕,可以獲得PDF和SVG下載。 編輯結果: 下載的PDF和SVG情節(jié)可以由AdobeIlluStrator編輯。下面是一個教程視頻: 來源:互聯網 免責聲明:文字及圖片來源于網絡(官網),僅供學習、交流使用,不具有任何商業(yè)用途,版權歸原作者所有,如有問題請及時聯系我們以作處理。本聲明未涉及的問題參見國家有關法律法規(guī),當本聲明與國家法律法規(guī)沖突時,以國家法律法規(guī)為準。 |
|