日韩黑丝制服一区视频播放|日韩欧美人妻丝袜视频在线观看|九九影院一级蜜桃|亚洲中文在线导航|青草草视频在线观看|婷婷五月色伊人网站|日本一区二区在线|国产AV一二三四区毛片|正在播放久草视频|亚洲色图精品一区

分享

蛋白質(zhì)組學相關數(shù)據(jù)庫與使用方法

 paul2020 2018-07-14

質(zhì)譜技術(shù)是通過肽段質(zhì)荷比的匹配來判別蛋白質(zhì)的種類,其原理就是利用蛋白序列數(shù)據(jù)庫中的多肽質(zhì)量信息與實際測得的質(zhì)量信息進行對比而實現(xiàn)鑒定的。因此蛋白質(zhì)組數(shù)據(jù)庫是研究蛋白質(zhì)組學的基礎,基于質(zhì)譜技術(shù)的蛋白質(zhì)組學分析或鑒定結(jié)果的質(zhì)量首先取決于數(shù)據(jù)庫的來源與數(shù)據(jù)庫的質(zhì)量。那么有那些來源的數(shù)據(jù)庫能用于蛋白組學研究呢?


蛋白質(zhì)組數(shù)據(jù)庫的來源


Uniprot數(shù)據(jù)庫

UniProt是Universal Protein的英文縮寫,被認為是收錄最廣泛、注釋信息最全面的蛋白質(zhì)數(shù)據(jù)庫。它由Swiss-Prot、TrEMBL和PIR-PSD三大數(shù)據(jù)庫的數(shù)據(jù)整合而成。其數(shù)據(jù)主要來自于基因組測序項目完成后獲得的蛋白質(zhì)序列,并包含了大量來自文獻和人工注釋的蛋白質(zhì)的生物功能的信息。


  • Swiss-Prot?高質(zhì)量的、手工注釋的、非冗余的數(shù)據(jù)集

  • TrEMBL?該數(shù)據(jù)集包含高質(zhì)量的計算分析結(jié)果

  • PIR-PSD是一個綜合性的非冗余數(shù)據(jù)庫


獲取UniProt相應物種數(shù)據(jù)庫的步驟:

圖1  獲取UniProt相應物種數(shù)據(jù)庫


NCBI數(shù)據(jù)庫

NCBI是世界上最大的基因數(shù)據(jù)庫。收錄了70,000多種生物的核苷酸序列,每條紀錄都有編碼區(qū)(CDS)特征的注釋,還包括氨基酸的翻譯,主要是科研人員直接提供或來源于大規(guī)?;蚪M測序計劃。有兩種方式獲取蛋白序列,一是來自特定基因組版本的蛋白序列,二是獲取所有和關鍵字或物種相關的蛋白序列。但后者獲得的數(shù)據(jù)庫蛋白重復度較高,優(yōu)先推薦使用UniProt的數(shù)據(jù)庫。

圖2  NCBI蛋白數(shù)據(jù)庫獲得


基因組de novo拼接

如果僅僅有基因組的數(shù)據(jù),可以先對基因組上的基因進行注釋,將注釋后的結(jié)果翻譯成蛋白來獲取蛋白數(shù)據(jù)庫。圖3描述了從基因組到蛋白庫的分析過程。

圖3  基因組蛋白數(shù)據(jù)庫獲得


轉(zhuǎn)錄組

如果在公共數(shù)據(jù)庫中沒有相應物種的蛋白數(shù)據(jù)庫或記錄蛋白條目較少,可以考慮先做轉(zhuǎn)錄組學,將轉(zhuǎn)錄組學數(shù)據(jù)翻譯成蛋白作為蛋白質(zhì)組學分析的理論數(shù)據(jù)庫?;谵D(zhuǎn)錄組數(shù)據(jù)的蛋白質(zhì)組學分析得到的蛋白數(shù)據(jù)更加全面。

圖4   轉(zhuǎn)錄組蛋白數(shù)據(jù)庫獲得


其他蛋白數(shù)據(jù)庫

Ensembl數(shù)據(jù)庫,開始于一個真核生物基因組注釋項目,其側(cè)重于脊椎動物的基因組數(shù)據(jù)以及注釋數(shù)據(jù),但也包含了其他生物,如線蟲,酵母,擬南芥和水稻等。

phytozome植物數(shù)據(jù)庫,包含了大約有100多種植物基因組數(shù)據(jù)和其注釋的數(shù)據(jù),如大豆,油菜,水稻等。



    本站是提供個人知識管理的網(wǎng)絡存儲空間,所有內(nèi)容均由用戶發(fā)布,不代表本站觀點。請注意甄別內(nèi)容中的聯(lián)系方式、誘導購買等信息,謹防詐騙。如發(fā)現(xiàn)有害或侵權(quán)內(nèi)容,請點擊一鍵舉報。
    轉(zhuǎn)藏 分享 獻花(0

    0條評論

    發(fā)表

    請遵守用戶 評論公約

    類似文章 更多