淺談Deeptools—生信之深海利器https://www./figure/Examples-of-images-created-with-deepTools-A-Overview-of-the-deepTools-workflow-that_fig2_262076117 2. 歷年高分文章中的Deeptools美圖: Embryonic transcription is controlled by maternally defined chromatin state Two independent modes of chromatin organization revealed by cohesin removal The pioneer factor OCT4 requires the chromatin remodeller BRG1 to support gene regulatory element function in mouse embryonic stem cells computeGCBias 用Benjamini’s 的方法計算GC-bias 并進行可視化展示,如下圖所示: 知道了DeepTools的滿腹才華,如何才能發(fā)揮DeepTools的作用呢?在此,小編想要細致的介紹兩個模塊的使用,以來給大家舉個”栗子”: · Correlation between BAM files (計算bam文件相關性) · multiBamSummary · 原理: · 將基因組劃bin,通過bam文件計算每個bin reads的覆蓋度(Coverage) · 用法: · multiBamSummary bins --bamfiles H3K9me3.sort.bam H3k27me3.sort.bam H3K4me3.sort.bam H3K4me1.sort.bam input.sort.bam --minMappingQuality 30 --region 1 --labels H3K9me3 H3k27me3 H3K4me3 H3K4me1 input -out readCounts.npz --outRawCounts readCounts.tab · 參數(shù)講解: · bins 代表按照bin 劃分基因組,默認10k為一個窗口 · --bamfiles 一系列已經(jīng)sort過的bam文件 · --minMappingQuality 比對質量閾值 · --region 基因組的區(qū)域默認none 可以寫成 1,chr1,chr1:456700:891000的形式 · --labels 標簽 · -out 輸出bin的readscount 矩陣,(npz 為numpy 存儲的文件) · --outRawCounts 同上,為tab分割的文本文件 · plotCorrelation · 原理: · 針對multiBamSummary 產(chǎn)生的矩陣,利用pearson 或者spearman 計算樣本間的相關性 · 用法: · plotCorrelation -in readCounts.npz –corMethod spearman --skipZeros --plotTitle 'Spearman Correlation of Read Counts' --whatToPlot heatmap --colorMap PuRd –plotNumbers -o heatmap_SpearmanCorr_readCounts.png --outFileCorMatrix SpearmanCorr_readCounts.tab · 參數(shù)講解: · -in 輸入 ,文件為 multiBamSummary 產(chǎn)生的矩陣 · --corMethod 相關性分析的方法:pearson 或者spearman · --colorMap 選取色系 · -o 圖像輸出路徑: · 結果展示 此圖非常直觀的展示了各個組蛋白之間的相關性 · 計算TSS 區(qū)域內的富集程度 · computeMatrix · 對基因區(qū)域以及上下游劃bin,計算每個bin內Chip的信號強度 · 用法: · computeMatrix scale-regions -S G_K4me3_1.bw G_K27ac_1.bw G_K4ME1_1.bw G_K27me3 D_K4me3_1.bw D_K27ac_1.bw D_K4ME1_1.bw D_K27me3 -R up.Gene.bed down.Gene.bed –beforeRegionStartLength 5000 --regionBodyLength 5000 –afterRegionStartLength 5000 --skipZeros -o matrix.mat.gz · 參數(shù)講解: · -S score file bigwig文件 · -R 參考基因組 bed文件,如果有多個bed的文件 以空格分開 · --beforeRegionStartLength 基因上游長度 · --regionBodyLength 基因body · --afterRegionStartLength 基因下游長度 · plotHeatmap · 基因的ChIP的信號強度按照基因上下游所有bin的信號強度的均值進行排序并通過熱圖進行展示 · 用法: · plotHeatmap -m matrix.mat.gz -out compare_heatmap.png · 參數(shù)講解: · -m computeMatrix 步驟所產(chǎn)生的矩陣 · -o 輸出文件 · 結果展示: |
|
來自: 生物_醫(yī)藥_科研 > 《待分類》