微信公眾號(hào):生信小知識(shí) 關(guān)注可了解更多的教程及生信小知識(shí)。問題或建議,請(qǐng)公眾號(hào)留言;
目錄 前言 0. 美圖 Figure1 Figure2 Figure3 1. Main 2. Predictions using motifs and conservation 3. Predictions from regulator binding 4. Predictions using chromatin accessibility 5.Predictions from histone modifications 后記
前言 從去年8月份左右到現(xiàn)在,公眾號(hào)的更新基本算是停止了,主要原因是因?yàn)橐厴I(yè)了,而自己又沒什么東西可以畢業(yè),所以一直在利用自己學(xué)到的生物信息學(xué)技術(shù)來想辦法畢業(yè)。終于,經(jīng)過了小半年,文章差不多了,所以,生信小知識(shí)的分享又開始了 ~
最近想學(xué)習(xí)下ChIP-seq的分析,為了能夠更好地理解分析出來的結(jié)果 ,所以有必要先補(bǔ)習(xí)下轉(zhuǎn)錄調(diào)控 相關(guān)知識(shí)啦~
這里就直接看一篇綜述來補(bǔ)習(xí)下吧!
Title : Transcriptional enhancers: from properties to genome-wide predictions
Journal : Nature review genetics
Download_url : https://www./articles/nrg3682
這篇文章寫的還是很棒的!內(nèi)容也超級(jí)多,所以,內(nèi)容注定會(huì)很長(zhǎng)了~
我就按照綜述的結(jié)構(gòu),分章節(jié)歸納總結(jié)。
當(dāng)然了,我還是主要記錄我自己不懂的地方,如果想要徹底學(xué)習(xí)理解,當(dāng)然要自己去看原文了!
0. 美圖 其實(shí)這篇文章中,最精彩地方之一就是他的配圖了!超級(jí)好看,且清晰明了 。這里先放上圖,如果看不懂請(qǐng)結(jié)合后面的內(nèi)容理解這些圖。如果看懂了,后面的內(nèi)容則可看可不看啦~
Figure1 Figure 1 | Enhancers and their features .
Figure2 Figure 2 | Chromatin accessibility and histone marks at regulatory elements .
Figure3 Figure 3 | Genomic methods for predicting enhancers through the detection of transcription factor binding, 'open’ chromatin, chromatin marks, or long-range contacts.
1. Main 核心啟動(dòng)子:保證RNA聚合酶Ⅱ轉(zhuǎn)錄正常起始所必需的、最少的 DNA序列,包括轉(zhuǎn)錄起始位點(diǎn) 及轉(zhuǎn)錄起始位點(diǎn)上游TATA區(qū)(這句話來自百度百科)。能夠招募RNA聚合酶Ⅱ轉(zhuǎn)錄機(jī)器。但是只有核心啟動(dòng)子的存在,轉(zhuǎn)錄活性非常弱,而增強(qiáng)子/順式作用元件則可以調(diào)控轉(zhuǎn)錄活性。
最早的增強(qiáng)子是30多年前在SV40病毒 (猿猴病毒40)基因組上發(fā)現(xiàn)的,他們發(fā)現(xiàn)在病毒gDNA序列中的一段72bp長(zhǎng)的序列可以提高HeLa細(xì)胞 中一個(gè)reporter基因的表達(dá)升高幾百倍。
增強(qiáng)子序列包含一小段DNA motif序列 ,這段序列可以讓轉(zhuǎn)錄因子(TF)結(jié)合 上來。而后TF招募其他co-factors (包括co-activators和co-repressors),TF和co-factors共同決定了增強(qiáng)子調(diào)節(jié)轉(zhuǎn)錄的活性 。
增強(qiáng)子的活性還被證明和染色質(zhì)狀態(tài) 相關(guān)(常/異染色質(zhì)),并且與染色質(zhì)的組蛋白修飾密 切相關(guān)。
關(guān)于組蛋白修飾 的總結(jié):
轉(zhuǎn)錄狀態(tài) Markers Markers Active promoter H3K4me3 H3K27Ac Active enhancer H3K4me1 H3K9Ac Repressor H3K9me3 H3K27me3 Transcribed gene body H3K36me3
增強(qiáng)子有幾個(gè)非常神奇的特性被很多研究者證實(shí): (1) 增強(qiáng)子發(fā)揮作用時(shí)獨(dú)立于靶基因的距離和方向 。也就是增強(qiáng)子可以距離靶基因非常遠(yuǎn),且增強(qiáng)子可以位于靶基因的下游,而不局限于上游。 (2) 增強(qiáng)子可以位于基因組任何位置,即使在異染色質(zhì)區(qū)域也不影響其發(fā)揮作用 。 (3) 增強(qiáng)子以模塊的形式發(fā)揮作用。同一個(gè)基因可能同時(shí)會(huì)受到多個(gè)增強(qiáng)子的影響。
2. Predictions using motifs and conservation 在轉(zhuǎn)錄過程中,一些轉(zhuǎn)錄因子等可以與DNA結(jié)合的蛋白通過在gDNA上進(jìn)行“掃描”,從而識(shí)別出Enhancer的位置 。
這些可以與DNA結(jié)合的蛋白質(zhì),他們與DNA結(jié)合的區(qū)域一般來說只有6-10bp 的長(zhǎng)度。并且在這6-10bp的范圍內(nèi),在某些位置上的堿基可以有多種不同的類型 (這個(gè)叫做'degenerate’ positions ,翻譯為“簡(jiǎn)并位置 ”)。
上面說到的蛋白質(zhì)(例如TF)與DNA結(jié)合的序列 ,通過一定的方法被歸納總結(jié)為了一個(gè)序列,這個(gè)序列就稱為TF的motif序列 。如果motif上序列發(fā)生突變,則于此處結(jié)合的Enhancer活性也會(huì)消失。
根據(jù)目前的認(rèn)識(shí):每個(gè)TF有他們自己偏愛的motif序列 。這使得我們?cè)谡麄€(gè)gDNA上預(yù)測(cè)尋找Enhancer更容易。目前在記錄motif序列上,一般使用PWM(https://www.jianshu.com/p/04b58d609070這里講的還不錯(cuò),至少我都看懂了)。這里簡(jiǎn)單記錄下關(guān)于motif的記錄方式:
Matrix-based
(矩陣方法):用矩陣將每個(gè)位置的A,G,C,T的量都表示出來。根據(jù)Matrix-based
記錄方法,我們可以換算得到count-matrix
,PFM
(position frequency matrix)和PWM
(position weight scoring)
目前一些常用的motif數(shù)據(jù)庫(kù):
TRANSFAC :10.1093/nar/gkj143(doi)
JASPAR :10.1093/nar/gkp950(doi)
UniPROBE :10.1093/nar/gkn660(doi)
但是通過motif在尋找Enhancer并不是非常完美的方法,以6bp的motif來說,在整個(gè)基因組上,每46 bp = 4096 bp就會(huì)出現(xiàn)一次。而只有很小一部分是真正有功能作用的Enhancer。
motif的功能是招募TF,而招募到的TF反過來招募co-factors。
3. Predictions from regulator binding ChIP-seq 實(shí)驗(yàn)通過化學(xué)交聯(lián) 與它們的體內(nèi)結(jié)合位點(diǎn)共價(jià)連接 ,然后打斷成為小片段,通過抗體識(shí)別TF,從而拖拽獲取TF連接的DNA片段。
ChIP-exo 實(shí)驗(yàn)則在ChIP-seq的基礎(chǔ)上,將TF結(jié)合的兩側(cè)翼多余序列用外切酶去除 ,只保留與TF直接結(jié)合的部分去測(cè)序 。
對(duì)于經(jīng)典的TF來說,通過ChIP-seq一般會(huì)發(fā)現(xiàn)TF結(jié)合在Promoters,Introns或者Intergenic區(qū)域 。而且對(duì)于ChIP-seq的結(jié)果來說,因?yàn)镃hIP-seq拉下來的都是直接與TF結(jié)合的位點(diǎn),所以一般來說結(jié)果假陰性的機(jī)會(huì)很低 。但是,并不是所有TF直接結(jié)合的地方都是有功能的,有時(shí)候TF可以結(jié)合在DNA上,但是卻不影響基因的表達(dá) 。
為了有很多地方有TF結(jié)合,但是卻沒有什么功能 (可能的假設(shè)):
TF結(jié)合后可以激活Enhancer,但是只有一個(gè)TF結(jié)合可能不足以激活轉(zhuǎn)錄 。
TF對(duì)于DNA有廣泛的親和力,即使不是TF匹配的motif,也可以短暫、低親和力地 結(jié)合在DNA上。(在ChIP-seq的甲醛交聯(lián) 過程中可以捕獲這種短暫的非功能性相互作用 ,特別是在延長(zhǎng)了交聯(lián)時(shí)間 的情況下,即使對(duì)于非DNA結(jié)合蛋白 也是如此)
轉(zhuǎn)錄因子可能通過與其他轉(zhuǎn)錄因子的相互作用而間接調(diào)節(jié)轉(zhuǎn)錄 。
我們可以通過檢測(cè)TF的co-factors來識(shí)別增強(qiáng)子的位置 ,例如組蛋白乙?;窹300 。
co-factors一般不與DNA直接連接,但是一般都是被TF招募過來,執(zhí)行不同的酶活性。
4. Predictions using chromatin accessibility 激活的增強(qiáng)子 一般缺失核小體的包繞 ,他們處于“開放”狀態(tài) 。
MNase-seq原理:金黃色葡萄球菌的微球菌核酸酶(MNase)既有內(nèi)切酶活性,又有外切酶活性。通過切割消化暴露在外的基因組片段來工作,被核小體及TF包繞保護(hù)DNA被保留并測(cè)序 。
DNase-seq原理:DNase是一個(gè)內(nèi)切酶,可以將DNA片段剪斷,但是不能進(jìn)行消化。
先鋒轉(zhuǎn)錄因子(pioneer factors):可以結(jié)合到有核小體包繞的DNA(異染色質(zhì))上 ,將核小體“擠走”,使整個(gè)DNA片段開放,使其他TF也可以結(jié)合上來 。例如FOXA1 就是一個(gè)先鋒轉(zhuǎn)錄因子。
Insulator(CTCF)也會(huì)主要富集在開放區(qū)域 。
5.Predictions from histone modifications 不同順式作用元件周圍的組蛋白修飾相對(duì)穩(wěn)定。
不同組蛋白修飾的意義:
轉(zhuǎn)錄狀態(tài) Markers Markers Active promoter H3K4me3 H3K27Ac Active enhancer H3K4me1 H3K9Ac Repressor H3K9me3 H3K27me3 Transcribed gene body H3K36me3
代表轉(zhuǎn)錄激活和轉(zhuǎn)錄抑制的組蛋白修飾可以同時(shí)存在:
latent enhancers:一些目前處于沒有任何組蛋白修飾狀態(tài) (關(guān)閉狀態(tài)),但是TF結(jié)合上去后立馬獲得組蛋白修飾 (H3K4me1和H3K27ac ),然后變成激活狀態(tài) 。
ChromHMM 方法可以結(jié)合多種組蛋白修飾 ,將基因組分成不同的染色質(zhì)狀態(tài) 。
目前對(duì)于增強(qiáng)子的染色質(zhì)狀態(tài)定義不清楚,主要原因有2個(gè):
后記 后面其實(shí)還有一部分內(nèi)容,但是我覺得和我想要了解的知識(shí)相關(guān)性不高,所以等日后有需要再來復(fù)習(xí)吧~