日韩黑丝制服一区视频播放|日韩欧美人妻丝袜视频在线观看|九九影院一级蜜桃|亚洲中文在线导航|青草草视频在线观看|婷婷五月色伊人网站|日本一区二区在线|国产AV一二三四区毛片|正在播放久草视频|亚洲色图精品一区

分享

來(lái)聊一聊那些五花八門的生信數(shù)據(jù)庫(kù)

 解螺旋 2020-08-27

新媒體管家

作者:麥子

轉(zhuǎn)載請(qǐng)注明:解螺旋·臨床醫(yī)生科研成長(zhǎng)平臺(tái)


當(dāng)我們資源不足時(shí),自然會(huì)想要找一些省錢的辦法來(lái)發(fā)文章,窮則思變嘛。生信是個(gè)好辦法,可是有些醫(yī)生朋友還是覺得不太熟悉,別說(shuō)后邊的分析方法了,就連最開始找數(shù)據(jù)都不好找。研究腫瘤的比較有福,腫瘤的數(shù)據(jù)最豐富了,像大名鼎鼎的TCGA、Ocomine等??裳芯科渌膊〉脑趺崔k,有沒有疾病特異性數(shù)據(jù)庫(kù)呢?

資源上哪找

隨著研究成果的積累,大大小小的數(shù)據(jù)庫(kù)們就冒了出來(lái),駐扎在互聯(lián)網(wǎng)的各個(gè)角落,現(xiàn)在已經(jīng)有了上千個(gè)。

找數(shù)據(jù)比較權(quán)威的資源集中站,是牛津大學(xué)出版社的Nucleic Acids Research(NAR)雜志。從1994年開始,NAR每年都要出版分子生物學(xué)數(shù)據(jù)庫(kù)特輯(database issue),收錄新增的數(shù)據(jù)庫(kù)、盤點(diǎn)舊數(shù)據(jù)庫(kù)的更新狀況、移除失效鏈接等,做個(gè)總結(jié)。目前最新版是第24版,即2017版。

而所有收錄的數(shù)據(jù)庫(kù)可以在NAR的網(wǎng)站上找到,下面是一個(gè)按字母排序的列表:

https://www./nar/database/a/

不過(guò)找起來(lái)更方便的可能是按功能分類查找:

https://www./nar/database/c/

NAR把數(shù)據(jù)庫(kù)分為15個(gè)類別(有些數(shù)據(jù)庫(kù)會(huì)同時(shí)被分到好幾個(gè)類別):

有些分類下邊還有子類別,可以跟據(jù)自己的目的逐級(jí)點(diǎn)開,找到相應(yīng)的資源。比如想找個(gè)特定的疾病,就點(diǎn)開Human Genes and Diseases,下邊還有4個(gè)子分類,其中癌癥基因數(shù)據(jù)庫(kù)是單獨(dú)一個(gè)子類(Cancer gene databases),其他的疾病可以點(diǎn)開Gene-, system- or disease-specific databases,就可看到具體數(shù)據(jù)庫(kù)列表。

這當(dāng)然只是一部分啦~

圖中可看到注意力缺陷多動(dòng)障礙(ADHDgene),自身免疫性淋巴細(xì)胞增生綜合征(ALPSbase),阿茲海默?。ˋlzGene)等等。

點(diǎn)進(jìn)去會(huì)有數(shù)據(jù)庫(kù)的描述說(shuō)明,或詳或略。并附有數(shù)據(jù)庫(kù)網(wǎng)站鏈接,點(diǎn)進(jìn)去就是了。

注意數(shù)據(jù)庫(kù)的質(zhì)量

數(shù)據(jù)庫(kù)這么多,也有大小之分,當(dāng)然不是隨便一個(gè)數(shù)據(jù)庫(kù)拿來(lái)就用,用了就能得到非常牢靠的研究成果。

一個(gè)成功的數(shù)據(jù)庫(kù)背后,要有良好的管理維護(hù)工作。大數(shù)據(jù)庫(kù)為什么著名、好用,是因?yàn)橛幸粋€(gè)大集團(tuán)在運(yùn)營(yíng)。比較著名的機(jī)構(gòu)有美國(guó)國(guó)家生物技術(shù)信息中心(NCBI)、歐洲分子生物學(xué)實(shí)驗(yàn)室-歐洲生物信息學(xué)研究所(EMBL-EBI)、瑞士生物信息學(xué)研究所(SIB)、日本國(guó)立遺傳學(xué)研究所(NIG)、華大基因(BGI)等。

而一些小團(tuán)隊(duì)為自己特定的研究領(lǐng)域創(chuàng)建的數(shù)據(jù)庫(kù),質(zhì)量就參差不齊了,上邊提到的疾病特異性數(shù)據(jù)庫(kù)大多屬于此類。

雖然小團(tuán)隊(duì)不容易跟大佬競(jìng)爭(zhēng),而且有時(shí)候同一個(gè)領(lǐng)域會(huì)有好幾個(gè)相似的數(shù)據(jù)庫(kù),NAR也不介意都收錄,只要它們符合一定質(zhì)量條件,且還在運(yùn)營(yíng)、維護(hù)、為研究者提供服。因?yàn)镹AR鼓勵(lì)良性競(jìng)爭(zhēng),讓那些數(shù)據(jù)庫(kù)經(jīng)歷時(shí)間的考驗(yàn)證明自己。像研究G蛋白耦聯(lián)受體的GPCRdb和研究碳水化合物活性酶的CAZy就是小團(tuán)隊(duì)的成功范例。

對(duì)于用戶來(lái)說(shuō),采用一個(gè)數(shù)據(jù)庫(kù)做研究之前要多留心,要了解好它的數(shù)據(jù)來(lái)源和運(yùn)營(yíng)維護(hù)情況,是否有及時(shí)回應(yīng)用戶的反饋,是否有版本控制;還要多檢索文獻(xiàn),看看這個(gè)數(shù)據(jù)庫(kù)的使用情況,大家利用它做出了哪些成果,反饋如何等等。必要時(shí)可多找?guī)讉€(gè)相關(guān)的數(shù)據(jù)庫(kù)互相佐證。

參考資料:

1. 生物信息學(xué):基礎(chǔ)及應(yīng)用. 清華大學(xué)出版社. 2014.

2. https://academic./nar

3. The 24th annual Nucleic Acids Research database issue: a look back and upcoming changes

    轉(zhuǎn)藏 分享 獻(xiàn)花(0

    0條評(píng)論

    發(fā)表

    請(qǐng)遵守用戶 評(píng)論公約

    類似文章 更多