?序列比較是生物信息學中最基本、最重要的操作,通過序列比對可以發(fā)現(xiàn)生物序列中的功能、結構和進化的信息。序列比較的根本任務是:通過比較生物分子序列,發(fā)現(xiàn)它們的相似性,找出序列之間共同的區(qū)域,同時辨別序列之間的差異。在分子生物學中,DNA或蛋白質的相似性是多方面的,可能是核酸或氨基酸序列的相似,可能是結構的相似,也可能是功能的相似。一個普遍的規(guī)律是序列決定結構,結構決定功能。研究序列相似性的目的之一是,通過相似的序列得到相似的結構或相似的功能。這種方法在大多數(shù)情況下是成功的,當然,也存在著這樣的情況,即兩條序列幾乎沒有相似之處,但分子卻折疊成相同的空間形狀,并具有相同的功能。這里先不考慮空間結構或功能的相似性,僅研究序列的相似性。研究序列相似性的另一個目的是通過序列的相似性,判別序列之間的同源性,推測序列之間的進化關系。這里,將序列看成由基本字符組成的字符串,無論核酸序列還是蛋白質序列,都是特殊的字符串.
BLAST全稱Basic Local Alignment Search Tool [1] ,即基于局部序列比對算法的搜索工具。是由美國國家生物技術信息中心(National Center for Biotechnology Information,NCBI)開發(fā)和管理的一套生物大分子一級結構序列比對程序。"BLAST"是美國國立醫(yī)學圖書館(U.S. National Library of Medicine)的注冊商標。 程序可將輸入的核酸堿基或蛋白質氨基酸序列與數(shù)據(jù)庫中的已知來源序列進行比對,輸出序列之間的同源性信息,從而輔助判斷輸入的序列來源或與已知序列的進化關系。目前這套軟件包含五種基本功能: 核酸序列對核酸序列庫比對(blastn):直接將輸入的核酸序列與數(shù)據(jù)庫中的核酸序列進行比對。 核酸序列對蛋白質序列庫比對(blastx):自動將輸入的核酸序列翻譯為蛋白質氨基酸序列后(根據(jù)可能的讀碼框和編碼鏈的差別,一段核酸序列可能翻譯為六種氨基酸序列),比對數(shù)據(jù)庫中的蛋白質序列。 蛋白質序列對蛋白質序列庫比對(blastp):直接將輸入的蛋白質氨基酸序列與數(shù)據(jù)庫中的氨基酸序列進行比對。 蛋白序列對核酸序列庫比對(tblastn):將輸入的蛋白質氨基酸序列,與由核酸數(shù)據(jù)庫中的序列翻譯而來的潛在的蛋白質氨基酸序列進行比對。 核酸序列的翻譯序列對核酸序列庫的翻譯序列的比對(tblastx):自動將輸入的核酸序列翻譯為蛋白質氨基酸序列后,與由核酸數(shù)據(jù)庫中的序列翻譯而來的潛在的蛋白質氨基酸序列進行比對。 BLAST程序有在線版亦有本地版。在線版可將輸入序列與龐大的已知來源序列信息庫進行比對,一般用于確定未知序列的來源,以及尋找不同物種中的同源基因;本地版是將輸入序列與本地自行構建的序列信息庫進行比對,比對的針對性更強,常用于在未發(fā)表基因組數(shù)據(jù)庫中尋找同源基因信息,不依賴于網(wǎng)絡,安全性和可靠性更高。
|
|