日韩黑丝制服一区视频播放|日韩欧美人妻丝袜视频在线观看|九九影院一级蜜桃|亚洲中文在线导航|青草草视频在线观看|婷婷五月色伊人网站|日本一区二区在线|国产AV一二三四区毛片|正在播放久草视频|亚洲色图精品一区

分享

ChIP-seq實踐(非轉錄因子,非組蛋白)

 閑庭之雨 2019-11-10

轉自 簡書 生信start_site

在實戰(zhàn)之前,首先對CHIP-seq分析做一些了解,以下是從各個地方copy過來綜合起來的,有些散亂,是我認為重要以及應該了解的知識點。
chip-seq 實戰(zhàn)就跟在轉錄組和外顯子上的實戰(zhàn)是沒有本質區(qū)別的,只是它多了一些分析,轉錄組只找表達量做差異分析,外顯子只找變異做變異注釋,那chip-seq 找的是peaks和motif 。
這里biobabble公眾號有比較完整的chip-seq的介紹:
CS1: ChIPseq簡介
CS2: BED文件
CS3: peak注釋
CS4:關于ChIPseq注釋的幾個問題
CS5: 吃著火鍋,唱著歌,還把分析給做了
CS6: ChIPseeker的可視化方法
CS7:Genomic coordination的富集性分析(1)
CS8:Genomic coordination的富集性分析(2)
CS9: GEO數(shù)據(jù)挖掘
CS番外1:如何定義下游的區(qū)間?

ChIP-seq 數(shù)據(jù)分析流程
1.得到原始序列文件后,第一步是執(zhí)行標準的高通量數(shù)據(jù)質量控制。
2.原始的 reads 回比到研究物種的參考基因組上
3.特異性 ChIP-seq 的質量控制,檢查 ChIP-seq 樣品中的富集情況,并排除過度碎片
4.【核心】鑒定全基因上感興趣的因子富集的區(qū)域,也叫 Peak calling
5.一旦確定了峰值區(qū)域,還可以評估需要峰值位置的特定 ChIP-seq 的質量控制措施
6.在 Peak calling 之后,要確保預測的峰值準確地捕捉到binding pattern。
7.Peak calling后的分析取決于實驗設計與生物學問題。比如,如果在實驗中有重復和/或多個條件,那么下一步可能是樣本之間的比較(見第 8 章)。生物學重復將提供有關數(shù)據(jù)(噪聲)中的重現(xiàn)性和內在生物和技術變異性的信息。差異結合分析解決了哪一Peak區(qū)域在兩種情況下顯示出明顯不同的豐度(例如:與觀察到的相同條件的重復之間的變化相比,差異比預期的要大得多)。
8.Peak區(qū)間或差異Peak做下游分析,比如基因組注釋、GO分析、Pathway 分析、motif 查找、與其他基因組數(shù)據(jù)聯(lián)合分析。(參考文章:https://www.jianshu.com/p/19b178ea406e

image.png

怎樣識別富集區(qū)域?(https://www.jianshu.com/p/df33bcb68548)
從DNA測序的角度來說,因為測序都是5'端的reads,對于一個DNA序列來說(有正負鏈的),它mapping的位置正負鏈都有的(也就是紅色和藍色的reads都有),對這些reads位置進行統(tǒng)計畫圖可以看到一個紅色的peak,一個藍色的peak。這兩個peak說明的是一個事情,就是這個地方有富集。最后對這兩個peak進行merge,最后變成了一個富集區(qū)域。灰色的peak!

image

ChIP-seq的常見峰型
不同類型的蛋白或者組蛋白修飾會得到不同的峰形:
sharp binding sites, CTCF (red);
a mixture of shapes, RNA Polymerase II (orange);
medium size, H3K36me3 (green);
large domains, H3K27me3 (blue)

image

富集倍數(shù)
一般來說富集倍數(shù)要在5以上才算是顯著,如何計算富集比率呢?看圖~

image

Chip-Seq實踐

需要用的軟件:
fastqc, sra-tools, bowtie2, samtools, MACS2, deeptools
上述軟件之前在RNA-seq實踐中已經(jīng)安裝了大部分,需要安裝MACS2和deeptools。
MACS2比較特殊,因為它需要Python2.7的環(huán)境才能安裝,而我的電腦安裝的是python3環(huán)境。所以首先創(chuàng)建一個虛擬環(huán)境,在python2.7的虛擬環(huán)境中使用(https://mp.weixin.qq.com/s/mEwl7-f2WTNfmK-FkNkP0A):

conda create -n py27 python=2
source activate py27
pip install MACS2

本次實踐的文章是:
RYBP and Cbx7 define specific biological functions of polycomb complexes in mouse embryonic stem cells
(探索PRC1,PCR2蛋白復合物,不是轉錄因子或者組蛋白的CHIP-seq)
本文主要講了PRC1(Polycomb repressive complex 1)在小鼠的胚胎干細胞中有兩類亞型Cbx7-PRC1和RYBP-PRC1,但是Cbx7和RYBP這兩種是不能共存的,盡管兩者的全基因組定位在某些gene上交叉,也就是說在基因組上結合在了同一個位置。在分子水平上,Cbx7用于招募Ring1B結合到染色質上,然而RYBP可以增強PRC1的酶活性。RYBP結合的基因,其有著了較低水平的Ring1B和H2AK119ub,但其相比結合Cbx7有較高的表達量。在功能上,RYBP結合的基因主要涉及代謝調節(jié)和細胞周期,Cbx7結合的基因主要涉及early-lineage commitment of ESCs。(這段來源:http://www./archives/358

1.下載原始數(shù)據(jù)
可以寫一個腳本,批量下載:

#!/bin/bash
for ((i=204;i<=209;i++))
do wget https://sra-download.ncbi.nlm./traces/sra6/SRR/000605/SRR620$i
done

2.下載之后提取fastq文件

#!/bin/bash
for i in SRR62020*
do
        echo $i
        fastq-dump --gzip --split-files $i
done

3.fastqc檢查測序質量
fastqc發(fā)現(xiàn)Ring1B、Suz12,IgG_old,IgG樣本的3’端有大約5個bp長度的堿基質量不是太好,可以在之后的bowtie2比對的時候設置參數(shù),把質量差的幾個堿基去掉。

4.bowtie2比對
首先下載bowtie2的mm10基因組索引:

 wget ftp://ftp.ccb.jhu.edu/pub/data/bowtie2_indexes/mm10.zip

還需要mm10 refseq注釋bed文件,進行網(wǎng)址下載http://genome./cgi-bin/hgTables,其中track和table選擇RefSeq,然后輸出格式為bed即可,最后下載(可以先在自己電腦上下載再傳到服務器上,也可以像下面直接在服務器上下載)(參考http://www./archives/358

curl 'http://genome./cgi-bin/hgTables?hgsid=646311755_P0RcOBvAQnWZSzQz2fQfBiPPSBen&boolshad.hgta_printCustomTrackHeaders=0&hgta_ctName=tb_ncbiRefSeq&hgta_ctDesc=table+browser+query+on+ncbiRefSeq&hgta_ctVis=pack&hgta_ctUrl=&fbQual=whole&fbUpBases=200&fbExonBases=0&fbIntronBases=0&fbDownBases=200&hgta_doGetBed=get+BED' >mm10.refseq.bed

用bowtie2進行比對(用腳本進行):

#!/bin/bash

bowtie2 -p 6 -3 5 --local -x /media/yanfang/FYWD/CHIPSEQ/bowtie2mm10/mm10 -U /media/yanfang/FYWD/CHIPSEQ/fqfile/SRR620204_1.fastq.gz | samtools sort -O bam -o ring1B.bam
bowtie2 -p 6 -3 5 --local -x /media/yanfang/FYWD/CHIPSEQ/bowtie2mm10/mm10 -U /media/yanfang/FYWD/CHIPSEQ/fqfile/SRR620205_1.fastq.gz | samtools sort -O bam -o cbx7.bam
bowtie2 -p 6 -3 5 --local -x /media/yanfang/FYWD/CHIPSEQ/bowtie2mm10/mm10 -U /media/yanfang/FYWD/CHIPSEQ/fqfile/SRR620206_1.fastq.gz | samtools sort -O bam -o Suz12.bam
bowtie2 -p 6 -3 5 --local -x /media/yanfang/FYWD/CHIPSEQ/bowtie2mm10/mm10 -U /media/yanfang/FYWD/CHIPSEQ/fqfile/SRR620207_1.fastq.gz | samtools sort -O bam -o RYBP.bam
bowtie2 -p 6 -3 5 --local -x /media/yanfang/FYWD/CHIPSEQ/bowtie2mm10/mm10 -U /media/yanfang/FYWD/CHIPSEQ/fqfile/SRR620208_1.fastq.gz | samtools sort -O bam -o IgGold.bam
bowtie2 -p 6 -3 5 --local -x /media/yanfang/FYWD/CHIPSEQ/bowtie2mm10/mm10 -U /media/yanfang/FYWD/CHIPSEQ/fqfile/SRR620209_1.fastq.gz | samtools sort -O bam -o IgG.bam
~                                                   

但是貌似對比率不高:

19687027 reads; of these:
  19687027 (100.00%) were unpaired; of these:
    7778437 (39.51%) aligned 0 times
    7766495 (39.45%) aligned exactly 1 time
    4142095 (21.04%) aligned >1 times
60.49% overall alignment rate
[bam_sort_core] merging from 4 files and 1 in-memory blocks...
20710168 reads; of these:
  20710168 (100.00%) were unpaired; of these:
    2584870 (12.48%) aligned 0 times
    10914615 (52.70%) aligned exactly 1 time
    7210683 (34.82%) aligned >1 times
87.52% overall alignment rate
[bam_sort_core] merging from 4 files and 1 in-memory blocks...
21551927 reads; of these:
  21551927 (100.00%) were unpaired; of these:
    7109852 (32.99%) aligned 0 times
    9455003 (43.87%) aligned exactly 1 time
    4987072 (23.14%) aligned >1 times
67.01% overall alignment rate
[bam_sort_core] merging from 4 files and 1 in-memory blocks...
39870646 reads; of these:
  39870646 (100.00%) were unpaired; of these:
    6312903 (15.83%) aligned 0 times
    20702502 (51.92%) aligned exactly 1 time
    12855241 (32.24%) aligned >1 times
84.17% overall alignment rate
[bam_sort_core] merging from 8 files and 1 in-memory blocks...
13291429 reads; of these:
  13291429 (100.00%) were unpaired; of these:
    5608796 (42.20%) aligned 0 times
    4663584 (35.09%) aligned exactly 1 time
    3019049 (22.71%) aligned >1 times
57.80% overall alignment rate
[bam_sort_core] merging from 2 files and 1 in-memory blocks...
31218866 reads; of these:
  31218866 (100.00%) were unpaired; of these:
    5370101 (17.20%) aligned 0 times
    15180536 (48.63%) aligned exactly 1 time
    10668229 (34.17%) aligned >1 times
82.80% overall alignment rate
[bam_sort_core] merging from 6 files and 1 in-memory blocks...

5.用MACS2進行call peak:
首先要進入python2.7的環(huán)境:

source activate py27

然后寫一個腳本:

#!/bin/bash
macs2 callpeak -c /media/yanfang/FYWD/CHIPSEQ/sambam/IgGold.bam -t /media/yanfang/FYWD/CHIPSEQ/sambam/Suz12.bam -m 10 30 -p 1e-5 -f BAM -g mm -n Suz12 2>Suz12.masc2.log
macs2 callpeak -c /media/yanfang/FYWD/CHIPSEQ/sambam/IgGold.bam -t /media/yanfang/FYWD/CHIPSEQ/sambam/ring1B.bam -m 10 30 -p 1e-5 -f BAM -g mm -n ring1B 2>ring1B.masc2.log
macs2 callpeak -c /media/yanfang/FYWD/CHIPSEQ/sambam/IgGold.bam -t /media/yanfang/FYWD/CHIPSEQ/sambam/cbx7.bam -m 10 30 -p 1e-5 -f BAM -g mm -n cxb7 2>cxb7.masc2.log
macs2 callpeak -c /media/yanfang/FYWD/CHIPSEQ/sambam/IgGold.bam -t /media/yanfang/FYWD/CHIPSEQ/sambam/RYBP.bam -m 10 30 -p 1e-5 -f BAM -g mm -n RYBP 2>RYBP.masc2.log

-t/–treatment 輸入文件,支持很多格式,搭配-f/–format使用
-f/–format 設定輸入文件的格式,這里選擇bam格式
-c/–control 對照組(或者模擬的)數(shù)據(jù),需要跟-t的輸出文件在相同目錄下
-n/–name 輸出文件(有很多個文件)的前綴
–outdir 輸出文件所在目錄(不設定的話就默認當前目錄了)
-g/–gsize 提供基因組的大小,程序有默認的幾個物種可以選hs,mm,ce,dm
-q/–qvalue 設定FDR的閾值,默認是0.05
-p/–pvalue 設定pvalue的閾值,如果參數(shù)設定了-p,則其會覆蓋參數(shù)-q的作用
-B/–bdg If this flag is on, MACS will store the fragment pileup, control lambda, -log10pvalue and -log10qvalue scores in bedGraph files.

參考文章(http://www./archives/363

運行后得到的文件不只是上述提到的一類,還有如下格式:
1.NAME_peaks.xls: 以表格形式存放peak信息,雖然后綴是xls,但其實能用文本編輯器打開,和bed格式類似,但是以1為基,而bed文件是以0為基.也就是說xls的坐標都要減一才是bed文件的坐標。
2.NAME_peaks.narrowPeak: NAME_peaks.broadPeak 類似。后面4列表示為, integer score for display, fold-change,-log10 pvalue,-log10 qvalue,relative summit position to peak start。內容和NAME_peaks.xls基本一致,適合用于導入R進行分析。
3.NAME_summits.bed:記錄每個peak的peak summits,話句話說就是記錄極值點的位置。MACS建議用該文件尋找結合位點的motif。
4.NAME_model.r: 能通過$ Rscript NAME_model.r作圖,得到是基于你提供數(shù)據(jù)的peak模型。

運行之后,看一下每個樣本找到多少個peak(bed的格式,儲存了每個peaks的位置信息):

$ wc -l *.bed     2754 cxb7_summits.bed     7193 ring1B_summits.bed      473 RYBP_summits.bed     6696 Suz12_summits.bed

本文作者在GEO給的PEAKS個數(shù)如下:
2754 GSE42466_Cbx7_peaks_10.txt
6982 GSE42466_Ring1b_peaks_10.txt
6872 GSE42466_RYBP_peaks_5.txt
8054 GSE42466_Suz12_peaks_10.txt
然而我查了幾篇對該文獻重復的文章,call peak的數(shù)目和文章也有較大差距。(https://cloud.tencent.com/developer/article/1055109
http://www./archives/363
https://mp.weixin.qq.com/s/_A0rHldzEgVk7bgwt457qQ?
https://mp.weixin.qq.com/s/mEwl7-f2WTNfmK-FkNkP0A

6.結果注釋與可視化
可視化這里我查閱了很多文章,分成兩種,有些人用的是chpseeker包進行peak的可視化和注釋;而還有一些人用了deeptool軟件進行分析。我兩種都試了試。

首先我用的是Chipseeker包。
ChIPseeker的功能分為三類(https://www.jianshu.com/p/c83a38915afc):
(1) 注釋:提取peak附近最近的基因, 注釋peak所在區(qū)域
(2)比較:估計ChIP peak數(shù)據(jù)集中重疊部分的顯著性;整合GEO數(shù)據(jù)集,以便于將當前結果和已知結果比較
(3)可視化: peak的覆蓋情況;TSS區(qū)域結合的peak的平均表達譜和熱圖;基因組注釋;TSS距離;peak和基因的重疊。

Chip peaks coverage plot

#調用要用的包
library("ChIPseeker")
library("org.Mm.eg.db")
library("TxDb.Mmusculus.UCSC.mm10.knownGene")
library("clusterProfiler")
#定位文件位置
setwd("/media/yanfang/FYWD/CHIPSEQ/bed")
#讀入bed文件
cbx7 <- readPeakFile("cxb7_peaks.narrowPeak.bed")
ring1B <- readPeakFile("ring1B_peaks.narrowPeak.bed")
Suz12 <- readPeakFile("Suz12_peaks.narrowPeak.bed")
#查看不同的蛋白的peak在染色體上的分布,因為RYBP的peak幾乎沒有,所以沒有用這個蛋白做后續(xù)的畫圖處理
covplot(cbx7, weightCol="V5")
covplot(ring1B, weightCol="V5")
covplot(Suz12, weightCol="V5")

例:cbx7的peak在染色體上的分布

#查看在指定的染色體上的分布
covplot(cbx7,chrs=c("chr17", "chr18"))

cbx7在第17和18號染色體上的分布

熱圖(Heatmap of ChIP binding to TSS regions)

# 定義TSS上下游的距離
> promoter <- promoters(TxDb.Mmusculus.UCSC.mm10.knownGene, upstream = 3000, downstream = 3000)> list_peak <- list(cbx7, ring1B, Suz12)> tagMatrix <- lapply(list_peak, getTagMatrix, window=promoter)> tagHeatmap(tagMatrix, xlim=c(-3000, 3000), color="red")

image.png

Average Profile of ChIP peaks binding to TSS region
用譜圖的形式來展示不同蛋白結合的強度:

> library(org.Mm.eg.db)
> library(TxDb.Mmusculus.UCSC.mm10.knownGene)
> library(VennDiagram)
> setwd("/media/yanfang/FYWD/CHIPSEQ/bed")
> cbx7 <- readPeakFile("cxb7_peaks.narrowPeak.bed")> ring1B <- readPeakFile("ring1B_peaks.narrowPeak.bed")> Suz12 <- readPeakFile("Suz12_peaks.narrowPeak.bed")> peaks <- list(cbx7=cbx7,ring1B=ring1B,Suz12=Suz12)
> txdb <- TxDb.Mmusculus.UCSC.mm10.knownGene> promoter <- getPromoters(TxDb=txdb, upstream=3000, downstream=3000)> tagMatrixList <- lapply(peaks, getTagMatrix, windows=promoter)> plotAvgProf(tagMatrixList, xlim=c(-3000, 3000))

image.png

還支持使用bootstrap估計置信區(qū)間:

plotAvgProf(tagMatrixList, xlim=c(-3000, 3000), conf = 0.95, resample = 1000)

image.png

注釋peak
ChIPseeker負責注釋的就是annotatePeak

#對于非向量的循環(huán),推薦構建list,然后用lapply> peaks <- list(ring1B, cbx7, Suz12)#注釋。啟動子區(qū)域是沒有明確的定義的,所以你可能需要指定tssRegion,把基因起始轉錄位點的上下游區(qū)域來做為啟動子區(qū)域。> peakAnnoList <- lapply(peaks, annotatePeak, tssRegion=c(-2500,2500), TxDb=TxDb.Mmusculus.UCSC.mm10.knownGene, 
                       addFlankGeneInfo=TRUE, flankDistance=5000)#結果可以用as.GRanges或者as.data.frame查看#Granges是R語言中的數(shù)據(jù)結構,它主要用來存儲基因組中的坐標區(qū)間。> as.GRanges(peakAnnoList[[1]])> as.data.frame(peakAnnoList[[1]])#畫圖,不同蛋白的靶位點的注釋情況> plotDistToTSS(peakAnnoList)

可視化TSS區(qū)域的TF binding loci

韋恩圖

genes= lapply(peakAnnoList, function(i) as.data.frame(i)$geneId)vennplot(genes[1:2:])

韋恩圖

注釋的可視化:

#先注釋
peakAnno <- annotatePeak(cbx7, tssRegion=c(-3000, 3000),
                         TxDb=txdb, annoDb="org.Mm.eg.db")
#柱形圖
plotAnnoBar(peakAnno)
#vennpie
vennpie(peakAnno)
#餅圖
plotAnnoPie(peakAnno)

柱形圖

vennpie

餅圖

# 展示注釋信息的交集$ upsetplot(peakAnno)

image.png

7.deeptools的使用
BAM文件是SAM的二進制轉換版,應該都知道。那么bigWig格式是什么?bigWig是wig或bedGraph的二進制版,存放區(qū)間的坐標軸信息和相關計分(score),主要用于在基因組瀏覽器上查看數(shù)據(jù)的連續(xù)密度圖,可用wigToBigWig從wiggle進行轉換。為什么要用bigWig? 主要是因為BAM文件比較大,直接用于展示時對服務器要求較大。因此在GEO上僅會提供bw,即bigWig下載,便于下載和查看。
(一)將bam文件轉換成bw(bigwig)文件
這一步需要用到的是deeptool里的bamCoverage工具:

#!/bin/bash
bamCoverage -b cbx7.bam -o cbx7.bw -p 10 --normalizeUsing RPKM
bamCoverage -b ring1B.bam -o ring1B.bw -p 10 --normalizeUsing RPKM
bamCoverage -b Suz12.bam -o Suz12.bw -p 10 --normalizeUsing RPKM
bamCoverage -b IgGold.bam -o IgGold.bw -p 10 --normalizeUsing RPKM

-b:指要進行操作的bam文件,后面跟的是bam文件名。
-o:指輸出的文件,后面跟的是要輸出的文件名。
-p: --numberOfProcessors,進程的數(shù)量。
--normalizeUsing: 標準化的方法。這個工具有RPKM, CPM, BPM, RPGC, None幾個不同的選擇,這里我選了RPKM。

(二)peak分布可視化
也是deeptool里的工具。為了統(tǒng)計全基因組范圍的peak在基因特征的分布情況,需要用到computeMatrix計算,用plotHeatmap以熱圖的方式對覆蓋進行可視化,用plotProfile以折線圖的方式展示覆蓋情況。
computeMatrix有兩種模式,scale-regions mode和reference-point mode(參考文章:https://www.jianshu.com/p/2b386dd437d3
reference-point(relative to a point): 計算某個點的信號豐度。給定一個bed file,以某個點為中心開始統(tǒng)計信號(TSS/TES/center)。
scale-regions(over a set of regions): 把所有基因組區(qū)段縮放至同樣大小,然后計算其信號豐度。簡單來說會將給定bed file范圍內的結合信號做一個統(tǒng)計(指的是一段長度),并將基因長度統(tǒng)一scale到設定regionBdoyLength的長度,加上統(tǒng)計基因上游和下游Xbp的信號(beforeRegionStartLength參數(shù)和afterRegionStartLength參數(shù))
不管是哪一種,有兩個參數(shù)是必須的,-S提供bigwig文件,-R提供基因的注釋信息。

image

如果想得到單獨的文件,就是說每個樣品都有單獨的matrix文件,可以用下面的代碼:

#!/bin/bash
computeMatrix reference-point --referencePoint TSS -a 2500 -b 2500 -S /media/yanfang/FYWD/CHIPSEQ/bw/cbx7.bw -R /media/yanfang/FYWD/CHIPSEQ/bw/mm10.bed --skipZeros -o cbx7_matrix_TSS.gz
computeMatrix reference-point --referencePoint TSS -a 2500 -b 2500 -S /media/yanfang/FYWD/CHIPSEQ/bw/ring1B.bw -R /media/yanfang/FYWD/CHIPSEQ/bw/mm10.bed --skipZeros -o ring1B_matrix_TSS.gz
computeMatrix reference-point --referencePoint TSS -a 2500 -b 2500 -S /media/yanfang/FYWD/CHIPSEQ/bw/Suz12.bw -R /media/yanfang/FYWD/CHIPSEQ/bw/mm10.bed --skipZeros -o Suz12_matrix_TSS.gz
computeMatrix reference-point --referencePoint TSS -a 2500 -b 2500 -S /media/yanfang/FYWD/CHIPSEQ/bw/IgGold.bw -R /media/yanfang/FYWD/CHIPSEQ/bw/mm10.bed --skipZeros -o IgGold_matrix_TSS.gz

reference-point: 選擇模式,這里我選擇了第二種。
-p 10:指10個進程。我的電腦比較渣,所以沒有加這個參數(shù)。
--referencePoint TSS:選擇參考點,這里選擇轉錄起始位點。
-a 3000:下游3000bp
-b 3000:上游3000bp
-S:指bw文件,后面跟的是文件的位置。
-R:參考基因組的注釋文件,這里要求是bed格式的。后面跟的是文件的位置。
--skipZeros:Whether regions with only scores of zero should be included or not. Default is to include them.
-o:輸出文件,后面跟的是輸出文件的名字

如果想把四個樣品合在一起,后續(xù)畫圖也是merge在一起的,可以用下面的代碼:

$ computeMatrix reference-point --referencePoint TSS -a 2500 -b 2500 -S /media/yanfang/FYWD/CHIPSEQ/bw/*.bw -R /media/yanfang/FYWD/CHIPSEQ/bw/mm10.bed --skipZeros -o merge_matrix_TSS.gz

畫基因的TSS附近的profile和heatmap圖

image.png

#heatmap圖$ plotHeatmap -m merge_matrix_TSS.gz -out merge_heatmap.png#將heatmap圖輸出為pdf格式$ plotHeatmap --dpi 720 -m merge_matrix_TSS.gz -out merge_heatmap.pdf --plotFileFormat pdf#輪廓圖plotProfile -m merge_matrix_TSS.gz -out merge_profile.png#將輪廓圖輸出為pdf格式$ plotProfile --dpi 720 -m merge_matrix_TSS.gz -out merge_profile.pdf --plotFileFormat pdf#如果想把每個樣品的輪廓圖merge上在一個圖片里,在代碼后面加上--perGroup$ plotProfile -m merge_matrix_TSS.gz -out merge_profile.png --perGroup
$ plotProfile --dpi 720 -m merge_matrix_TSS.gz -out merge_profile.pdf --plotFileFormat pdf --perGroup

熱圖

把幾個樣品的輪廓圖merge到同一張圖里

也可以整合所有的chipseq的bw文件,畫基因的genebody附近的profile和heatmap圖(圖就不放上來了):

$ computeMatrix scale-regions -a 3000 -b 3000 -m 5000 -S /media/yanfang/FYWD/CHIPSEQ/bw/*.bw -R /media/yanfang/FYWD/CHIPSEQ/bw/mm10.bed --skipZeros -o merge_scaleregion_matrix_TSS.gz
$ plotHeatmap -m merge_scaleregion_matrix_TSS.gz -out merge_scaleregion_matrix_TSS.png
$ plotProfile -m merge_scaleregion_profile_TSS.gz -out merge_scaleregion_profile_TSS.png

    本站是提供個人知識管理的網(wǎng)絡存儲空間,所有內容均由用戶發(fā)布,不代表本站觀點。請注意甄別內容中的聯(lián)系方式、誘導購買等信息,謹防詐騙。如發(fā)現(xiàn)有害或侵權內容,請點擊一鍵舉報。
    轉藏 分享 獻花(0

    0條評論

    發(fā)表

    請遵守用戶 評論公約