聽說(shuō)看到這個(gè)標(biāo)題你是一臉懵逼的狀態(tài)!那就讓omicsPie的老司機(jī)們帶你飛吧!點(diǎn)贊關(guān)注打賞組學(xué)派的小伙伴們?cè)缇妥呱先松鷰p峰了,你還在等什么?仔細(xì)閱讀文章哦,文中有彩蛋,看你有沒(méi)有發(fā)現(xiàn)! 在組學(xué)研究課題中,如果提起數(shù)據(jù)庫(kù),你會(huì)想到什么?小編敢肯定,KEGG數(shù)據(jù)庫(kù)(Kyoto Encyclopedia of Genes and Genomes,京都基因與基因組百科全書)必將位列前幾位。作為系統(tǒng)生物學(xué)的重要工具,KEGG系統(tǒng)地包含了基因組、酶促反應(yīng)以及生物化學(xué)物質(zhì)等等,為基因組、轉(zhuǎn)錄組、蛋白組、代謝組等組學(xué)研究的數(shù)據(jù)挖掘提供了重要的支撐。 雖然KEGG可以在線訪問(wèn),但對(duì)組學(xué)研究的童鞋們來(lái)說(shuō),能夠批量訪問(wèn)和使用才是王道。今天,小編給介紹KEGG中為批量訪問(wèn)而提供的一個(gè)重要工具,KEGG API接口。通過(guò)它,大家就可以方便地將KEGG整合到大家的工作當(dāng)中。KEGG API是一個(gè)連接KEGG各類數(shù)據(jù)庫(kù)的應(yīng)用程序,主要以URL形式進(jìn)行訪問(wèn):http://rest./<operation>/<argument>[/<argument2[/<argument3> ...]]<operation> = info | list | find | get | conv | link | ddi 1. 總體的調(diào)用形式: URL 形式: http://rest./<operation>/<argument>[/<argument2[/<argument3> ...]] <operation> = info | list | find | get | conv | link | ddi 總共7種操作可以選擇,包括info, list, find, get, conv, link, ddi。后面會(huì)具體介紹。 Database 名稱 KEGG數(shù)據(jù)庫(kù)包括了三大類的數(shù)據(jù)庫(kù),包括 KEGG database; KEGG MEDICUS extension database; Outside database (主要用于ID的變換)。 Database entry identifier(標(biāo)識(shí)符) 命名規(guī)則: KEGG自身帶有17個(gè)數(shù)據(jù)庫(kù),除了“genes”, 'enzyme', 'variant'均使用KEGG 標(biāo)識(shí)符<kid>。 <kid>: 數(shù)據(jù)庫(kù)前綴 5位數(shù)字組成,比如K number (kegg orthology), C number (kegg compound), D number (kegg drug)。例:ADP的kid為C00008 genes: <org>:<gene>, <org>為KEGG organism code或T number genome identifier,<gene>是基因編號(hào),通常來(lái)自NCBI GeneID或INSDC Locus_tag。 例如hsa:10458為human的BAP2基因(NCBI-GeneID :1045) enzyme & variant: <database>:<entry>, <database>為database縮寫,<entry>是名稱或編號(hào)。 KEGG database Output: 純文本格式 操作list, find,conv, link:Tab分隔的文本 操作get:數(shù)據(jù)庫(kù)形式(flat file database format) 操作info:文本消息 HTTP狀態(tài): 狀態(tài)代碼 200: 成功 狀態(tài)代碼 400: 請(qǐng)求失敗 (比如語(yǔ)法錯(cuò)誤) 狀態(tài)代碼 404: 未找到 舉個(gè)簡(jiǎn)單的離子: 在瀏覽器中輸入http://rest./info/kegg,可以得到整個(gè)KEGG數(shù)據(jù)庫(kù)的統(tǒng)計(jì)信息 累了吧,送你一張實(shí)拍美圖,休息一下 KEGG API操作 1. Info: 呈現(xiàn)數(shù)據(jù)庫(kù)的統(tǒng)計(jì)信息 使用方法: 例:http://rest./info/kegg:所有KEGG數(shù)據(jù)庫(kù)的數(shù)目統(tǒng)計(jì)信息 2. List: 獲取每個(gè)條目的編號(hào)和定義 使用規(guī)范: 例: http://rest./list/pathway/hsa: 可以得到人類所有的代謝通路 也可以具體到某個(gè)或幾個(gè)基因:http://rest./list/hsa:10458 ece:Z5100 3. Find: 通過(guò)關(guān)鍵詞檢索數(shù)據(jù) 使用方法: 例: 搜索含有NAD的compound: http://rest./find/compound/NAD 所有分子式為C7H10O5的compound: http://rest./find/compound/C7H10O5/formula 平均分子量為300-310的compound: http://rest./find/compound/300-310/mol_weight 4. Get: 得到數(shù)據(jù)庫(kù)中的具體條目 使用方法: 例: 檢索編號(hào)為C01290的compound: http://rest./get/cpd:C01290 檢索人類編號(hào)為05130的pathway圖:http://rest./get/hsa05130/image 5. Conv: 把KEGG的標(biāo)識(shí)符轉(zhuǎn)化為其他標(biāo)識(shí)符 使用方法: 例: 把將KEGGID 轉(zhuǎn)化為NCBI Protein ID: http://rest./conv/ncbi-proteinid/hsa:10458 ece:Z5100 把編號(hào)為C00003的compound轉(zhuǎn)化為pubchem ID: http://rest./conv/pubchem/C00002 6. Link: 在不同數(shù)據(jù)庫(kù)之間進(jìn)行檢索,把KEGG的各個(gè)數(shù)據(jù)庫(kù)連接在一起 使用方法: 例:檢索pathway 00010中的compound:http://rest./link/cpd/map00010 檢索hsa10458基因參與的pathway: http://rest./link/pathway/hsa:10458 7. DDI: 藥物與藥物之間的作用 使用方法: 例:檢索藥物D00564的已知相互作用:http://rest./ddi/D00564 檢索藥物D00564、D00100、D00109相互之間的作用: http://rest./ddi/D00564 D00100 D00109 ![]() |
|