1. 基因轉(zhuǎn)錄本亞型 蛋白質(zhì)亞型或“蛋白質(zhì)變體“是一組高度相似的蛋白質(zhì)成員,這些成員來源于單個基因或基因家族,是遺傳差異造成的結(jié)果。雖然許多具有相同或相似的生物學(xué)作用,但一些亞型具有獨特的功能。這些高度相似的蛋白質(zhì)亞型可以由可變剪切(圖1)、可變啟動子或單基因的其他轉(zhuǎn)錄后修飾形成,通常不考慮翻譯后修飾。通過RNA剪切機制,mRNA具有從基因中選擇不同蛋白質(zhì)編碼區(qū)(外顯子)的能力,甚至是從RNA中選擇外顯子的不同部分以形成不同的mRNA序列,每個獨特的mRNA序列產(chǎn)生獨特的蛋白質(zhì)。 圖1 可變剪切產(chǎn)生不同的轉(zhuǎn)錄本和蛋白質(zhì) 1.1 可變剪切 可變剪切依據(jù)外顯子之間連接位置的不同,又可以具體細(xì)分為如下(圖2)幾種剪切方式:
圖2 不同的RNA剪切機制
2. 基因所有亞型外顯子區(qū)域獲取 樓主想研究一個基因所有外顯子區(qū)域,而不是單獨一個轉(zhuǎn)錄本的外顯子區(qū)域,因此需要獲取該基因的所有轉(zhuǎn)錄本信息,這里備選三個數(shù)據(jù)庫(NCBI、Ensembl和UCSC)供使用,以BRCA1為例。 2.1 使用NCBI數(shù)據(jù)庫獲取BRCA1基因的所有外顯子區(qū)域 2.1.1 選擇“Gene”數(shù)據(jù)庫,輸入基因名(例如,“BRCA1”),點“Search”按鈕搜索 2.1.2 根據(jù)物種(例如,“human”),點擊相應(yīng)基因鏈接
2.1.3 查看轉(zhuǎn)錄本個數(shù),點擊“GenBank”進(jìn)入詳情 2.1.4 點擊“Send to”,按下圖所示選擇相應(yīng)的項,點擊“Create File”創(chuàng)建“gff3”格式文件 2.2 使用Ensembl數(shù)據(jù)庫獲取BRCA1基因的所有外顯子區(qū)域 2.2.1 物種選擇“Human”數(shù)據(jù)庫,輸入基因名(例如,“BRCA1”),點“Go”按鈕搜索 2.2.2 選擇“BRCA1”鏈接,查看詳細(xì) 2.2.3 如圖所示,“BRCA1”共有33個轉(zhuǎn)錄本,點擊“Export data”按鈕,配置相關(guān)參數(shù)導(dǎo)出數(shù)據(jù) 2.2.4 選擇輸出格式為“gff3”,輸出內(nèi)容只選擇“exon”,然后點擊“next”,如下圖所示 2.3 使用UCSC數(shù)據(jù)庫獲取BRCA1基因的所有外顯子區(qū)域 使用UCSC數(shù)據(jù)庫,需要安裝MySQL客戶端鏈接UCSC數(shù)據(jù)庫(不建議使用) 2.3.1 鏈接UCSC數(shù)據(jù)庫
2.3.2 查詢基因“BRCA1”,共有6個記錄
3. 小結(jié) NCBI、Ensembl和UCSC均可以對基因的轉(zhuǎn)錄本的所有外顯子進(jìn)行查詢,推薦使用Ensembl數(shù)據(jù)庫,其次NCBI數(shù)據(jù)庫,最后UCSC數(shù)據(jù)庫。
參考資料 |
|
來自: 王的宮殿7hgg9t > 《待分類》