火山圖(volcano plot)常用于顯著差異基因表達的展示,包含顯著和差異兩個重要信息。 那么如何看懂一張火山圖所包含的信息呢?首先需要知道,火山圖的橫坐標通常用log2(fold change)表示,差異越大的基因分布在兩端,縱坐標用-log10(pvalue)表示,T檢驗顯著性P值的負對數(shù)。由于P值越小表示越顯著,所以我們進行-log10(P value)轉(zhuǎn)化后,轉(zhuǎn)化值越大表示差異越顯著。通常差異倍數(shù)越大的基因T檢驗越顯著,所以左上角和右上角的值往往是我們關(guān)注的。 隨機生成log2FoldChange和padj的數(shù)值 log2FoldChange<-sample(rnorm(10000,mean=0,sd=4),1000,replace=T) padj<-sample(runif(10000,0,0.08),1000,replace=T) #log2FoldChange和padj合并到一個數(shù)據(jù)框 mydata <- data.frame(log2FoldChange,padj) ##對滿足不同條件的數(shù)據(jù)給不同的標記,放入Condition列,顏色放入color列 mydata$Condition=ifelse(mydata$log2FoldChange>=1 & mydata$padj<=0.05,'up',ifelse(mydata$log2FoldChange<=-1 & mydata$padj<=0.05,'down','normal')) mydata$color=ifelse(mydata$log2FoldChange>=1 & mydata$padj<=0.05,'red',ifelse(mydata$log2FoldChange<=-1 & mydata$padj<=0.05,'green','gray'))
接下來就開始畫圖。 1.直接用plot畫圖
結(jié)果圖如下所示: 2.用ggplot2畫圖 library(ggplot2) p <-ggplot(data=mydata, aes(x=log2FoldChange, y=-log10(padj), colour=Condition)) + geom_point(alpha=0.8, size=1) + xlab('log2 fold change') + ylab('-log10 padj')+geom_hline(yintercept=-log10(0.05),linetype=4)+geom_vline(xintercept=c(-1,1),linetype=4)+scale_color_manual(values=c('up'='red','down'='green','normal'='gray')) p 結(jié)果如下圖所示: |
|
來自: 生物_醫(yī)藥_科研 > 《待分類》