近年來,隨著高通量測序技術(shù)的發(fā)展,轉(zhuǎn)錄組測序已經(jīng)成為研究基因表達調(diào)控的主要手段。我們知道,很多物種的轉(zhuǎn)錄本非常多樣和復(fù)雜,絕大多數(shù)真核生物基因不符合“一基因一轉(zhuǎn)錄本”的模式,這些基因往往存在多種剪切形式。通過二代測序,可以很準確地進行基因的表達及定量的研究,但是由于讀長的限制,不能得到全長轉(zhuǎn)錄本的信息。因此,基于三代測序平臺的全長轉(zhuǎn)錄組成為新的研究熱潮。 全長轉(zhuǎn)錄組(Full-length transcriptome)是基于PacBio和Nanopore三代測序平臺,無需打斷拼接,直接獲得包含5’UTR、3’UTR、polyA尾的mRNA全長序列及完整結(jié)構(gòu)信息,從而準確分析有參考基因組物種可變剪接及融合基因等結(jié)構(gòu)信息,克服無參考基因組物種轉(zhuǎn)錄本拼接較短、信息不完整的難題。同時還可以借助二代測序數(shù)據(jù),進行轉(zhuǎn)錄本特異性表達分析,獲得更加全面的注釋信息。
圖1 大鼠中已證實的全長轉(zhuǎn)錄本 圖2 全長轉(zhuǎn)錄組實驗流程 全長轉(zhuǎn)錄組采用單分子實時測序技術(shù),通過構(gòu)建啞鈴型文庫,以環(huán)形方式循環(huán)測序。測序時,短片段文庫更容易落入零模波導(dǎo)孔(ZMWs)。 
Polymerase read: 三代測序直接讀取的序列,包含接頭和插入片段; Subreads: 將Polymerase read接頭去除,插入片段每測一次,生成一條subread; CCS read: 來源于同一條Polymerase read的subreads (至少兩條)生成的一致性序列。
針對有參考基因組的物種,全長轉(zhuǎn)錄組信息可以糾正基因組的錯誤組裝、更準確地發(fā)現(xiàn)新的轉(zhuǎn)錄本和基因、分析基因融合事件等。 針對參考基因組不完善的物種,全長轉(zhuǎn)錄組可優(yōu)化基因結(jié)構(gòu),輔助基因組組裝和注釋,提高基因表達量準確性和數(shù)據(jù)利用率。針對無參考基因組的物種,通過三代全長轉(zhuǎn)錄組測序來構(gòu)建物種Unigene庫,無需進行序列組裝,就可以獲得該物種轉(zhuǎn)錄組水平的參考序列(轉(zhuǎn)錄組水平的參考基因組),為后續(xù)研究提供很好的遺傳信息基礎(chǔ)。轉(zhuǎn)錄組具有時空特異性,根據(jù)研究目的進行實驗設(shè)計,如下: 圖4 全長轉(zhuǎn)錄組實驗設(shè)計 建議2+3代轉(zhuǎn)錄組測序技術(shù)同時使用,保證結(jié)構(gòu)準確性、序列完整性及序列表達量準確性,達到數(shù)據(jù)的最優(yōu)利用效果以及性價比最高。針對不同要求及目的,對于大部分物種來說推薦測序數(shù)據(jù)量8-12G,研究低表達基因、可變剪切事件、多倍體或者基因數(shù)目較多的物種,需適量增加數(shù)據(jù)量。獲得原始測序序列(Sequenced Reads)后,通過如下流程進行生物信息分析:
圖5 凌恩生物全長轉(zhuǎn)錄組生物信息分析流程 凌恩生物全長轉(zhuǎn)錄組測序優(yōu)勢 - 無需進行轉(zhuǎn)錄本拼接,能夠直接獲得全長轉(zhuǎn)錄本序列,從而更真實的反映測序物種的轉(zhuǎn)錄組信息;
能夠檢測多種可變剪切形式,發(fā)現(xiàn)更多的剪接位點和可變剪切事件; 能夠發(fā)現(xiàn)新的功能基因,補充基因組注釋; 有助于融合基因、同源基因、超家族基因或等位基因的精確分析; 專業(yè)的生信分析團隊,項目經(jīng)驗豐富。
一般總RNA>5 ug/文庫,總量>15 ug(3個文庫),濃度≧250ng/ul。 OD260/280≧1.8,OD260/230≧1.0,260nm處有正常峰值;總RNA的RIN值≧8.0,28S/18S≧1.3。 采用安全染料,避免EB和紫外照射對cDNA造成損傷。 總之,三代全長轉(zhuǎn)錄組對于有參物種和無參物種均適用,獲得更多的轉(zhuǎn)錄調(diào)控事件,從而更真實的反映測序物種的轉(zhuǎn)錄組信息。目前,全長轉(zhuǎn)錄組測序研究基因結(jié)構(gòu)已經(jīng)成為發(fā)文章的趨勢,研究物種包括高粱、玉米、擬南芥、雞、人和小鼠、毛竹、棉花等。凌恩生物提供專業(yè)的全長轉(zhuǎn)錄組測序及分析服務(wù),助力您的研究!

|