測(cè)序不要只看價(jià)格和參數(shù),測(cè)序前采用什么富集技術(shù)或建庫(kù)方案、使用哪家的產(chǎn)品、捕獲區(qū)域的大小、測(cè)序的深度等都直接關(guān)系到價(jià)格;而漂亮參數(shù)背后大都藏有玄機(jī),需要大家對(duì)目標(biāo)區(qū)域和自己的研究目的有更深入的了解方可不被表象所迷惑。
外行看熱鬧,內(nèi)行看門(mén)道。如何評(píng)估和選擇二代測(cè)序靶向捕獲基因文庫(kù),你已經(jīng)摸著門(mén)道還是就看個(gè)熱鬧?
如果你建庫(kù)與測(cè)序一并外包;如果你困惑于不同廠家的同類(lèi)捕獲 panel;如果你正在因?yàn)閮r(jià)格差異而猶豫不決;如果你癡迷于捕獲效率、覆蓋度;那么你一定要看過(guò)來(lái)。
大家通常會(huì)利用測(cè)序的結(jié)果來(lái)評(píng)估一款捕獲產(chǎn)品的優(yōu)劣,通常關(guān)注的參數(shù)有覆蓋度、同樣測(cè)序量下的測(cè)序深度、目標(biāo)序列比率(或捕獲效率)等。咱們先看看這些名字解釋,再以市場(chǎng)上幾家公司的外顯子組產(chǎn)品為例教你如何辨識(shí)這些參數(shù)。
· 覆蓋度(%coverage):一般是指目標(biāo)區(qū)域中被測(cè)序覆蓋 > 1x 的區(qū)域的比例
· 平均測(cè)序深度(Sequencing Depth):測(cè)序得到的堿基總量與目標(biāo)序列堿基的比值,也可以理解為被測(cè)基因組上單個(gè)堿基被測(cè)序的平均次數(shù)
· 測(cè)序深度 > 20x 的覆蓋度:目標(biāo)區(qū)域中測(cè)序深度 > 20x 的區(qū)域占總目標(biāo)區(qū)域的比例
· 目標(biāo)序列比率或捕獲效率(% on-target reads):目標(biāo)區(qū)域序列數(shù)與測(cè)定的總序列的比值
我們都知道,外顯子組有的區(qū)域 GC 含量低、AT 含量高,探針結(jié)合力弱,捕獲效率低;有的區(qū)域因?yàn)榇嬖谥貜?fù)序列、二級(jí)結(jié)構(gòu)等不易設(shè)計(jì)探針,即使有探針覆蓋,捕獲效率也不高。而像覆蓋度、捕獲效率這些參數(shù)都與靶標(biāo)的設(shè)計(jì)直接相關(guān)。
也就是說(shuō),如果想讓這些參數(shù)好看,很簡(jiǎn)單,跳過(guò)那些捕獲效率低、難設(shè)計(jì)探針的區(qū)域,將設(shè)計(jì)的靶標(biāo)區(qū)域僅包括那些容易設(shè)計(jì)探針、捕獲效率高而均一的區(qū)域。
如果你只關(guān)注上面的參數(shù),僅根據(jù)這些參數(shù)來(lái)選擇產(chǎn)品的話,最終的結(jié)果可能是參數(shù)很漂亮,但卻承擔(dān)了丟失真正有意義的靶標(biāo)的風(fēng)險(xiǎn),并且這種風(fēng)險(xiǎn)是無(wú)法通過(guò)提高測(cè)序深度來(lái)彌補(bǔ)的,因?yàn)槟切┌袠?biāo)根本不在這款外顯子的設(shè)計(jì)里!
同樣以全外顯子組為例,評(píng)價(jià)它的優(yōu)劣首先要以該產(chǎn)品的設(shè)計(jì)為出發(fā)點(diǎn),客觀的比較它對(duì)于各大數(shù)據(jù)庫(kù)的覆蓋,以及與其它同類(lèi)產(chǎn)品相比所獨(dú)有的有意義的靶點(diǎn)的數(shù)量。這里特別提醒一下,一些廠家在給出捕獲產(chǎn)品的參數(shù)時(shí)有時(shí)會(huì)經(jīng)過(guò)「藝術(shù)處理」。
比如,有的廠家給出的捕獲區(qū)域的大小是期望捕獲的區(qū)域而非探針實(shí)際覆蓋的區(qū)域[1],在比較數(shù)據(jù)庫(kù)的覆蓋度時(shí),這些廠家的數(shù)據(jù)會(huì)比較美觀,但當(dāng)我們查看實(shí)際測(cè)序結(jié)果所反映的捕獲數(shù)據(jù)時(shí),那些經(jīng)過(guò)「藝術(shù)處理」的廠家就沒(méi)有那么漂亮了。
其實(shí)所有廠家都清楚,設(shè)計(jì)(design)是一款產(chǎn)品的根基,是產(chǎn)品的關(guān)鍵,如果根基不扎實(shí)、不完善,那么后期無(wú)論如何努力也是無(wú)法彌補(bǔ)這款產(chǎn)品的先天不足的。
安捷倫臨床研究外顯子組 V2 是專門(mén)針對(duì)臨床研究設(shè)計(jì)的一款全外顯子組產(chǎn)品,它以安捷倫全外顯子組 V6 的設(shè)計(jì)為基礎(chǔ),新增了美國(guó)埃默里大學(xué)和費(fèi)城兒童醫(yī)院精選的新增靶標(biāo),同時(shí)對(duì)疾病相關(guān)基因進(jìn)行了加強(qiáng)覆蓋,是目前市場(chǎng)上極為全面的醫(yī)學(xué)研究外顯子組。
先看一下它與市場(chǎng)上其它同類(lèi)產(chǎn)品在各大數(shù)據(jù)庫(kù)覆蓋上的比較。
表 1. 所選注釋源的覆蓋率比較 表 1. 所選注釋源的覆蓋率比較
* 數(shù)據(jù)采集于 2016 年 5 月
再來(lái)看看獨(dú)有的有意義的靶點(diǎn)的數(shù)量的差異吧。安捷倫的臨床研究外顯子組 V2 不僅包含更多的獨(dú)有的疾病相關(guān)變異,同時(shí)含有更多獨(dú)有的 ClinVar 致病 / 可能致病變異,而這些 ClinVar 致病 / 可能致病變異意味著更多種類(lèi)的疾病被安捷倫的這款產(chǎn)品覆蓋。
表 2. 獨(dú)有的 ClinVar 變異比較
看完了上述比較,一款捕獲產(chǎn)品的核心競(jìng)爭(zhēng)力和對(duì)用戶的價(jià)值一目了然。當(dāng)然,沒(méi)有一款產(chǎn)品是完美的,包含的位點(diǎn)越全,設(shè)計(jì)難度就越大。盡管如此,憑借在靶向捕獲領(lǐng)域扎實(shí)的功底,安捷倫的這款全面的醫(yī)學(xué)研究外顯子組——臨床研究外顯子組 V2 仍舊在覆蓋度和捕獲效率上表現(xiàn)非常出色。 除了選產(chǎn)品本身,別忘了考察一下定制能力。數(shù)據(jù)庫(kù)更新的速度非常快,廠家推出穩(wěn)定、可靠的商業(yè)化產(chǎn)品的速度無(wú)法及時(shí)跟上。所以,這里就要強(qiáng)調(diào)定制的重要性了。
安捷倫的 SurePrint 打印技術(shù)提供了非常強(qiáng)的定制能力,它的免費(fèi)在線設(shè)計(jì)工具 SureDesign 就可以在已有目錄 panel 的基礎(chǔ)上按照用戶的要求加入新的基因。這樣一來(lái),新的實(shí)驗(yàn)數(shù)據(jù)既與原先的實(shí)驗(yàn)數(shù)據(jù)保持了很好的一致性,又增加了新的內(nèi)容。
通過(guò)以上簡(jiǎn)短的介紹后,希望大家都能摸到靶向捕獲基因文庫(kù)的門(mén)道,不再被表面的熱鬧所迷惑。
最新預(yù)報(bào):
安捷倫即將推出人全外顯子組 V7 版本。V7 版本的設(shè)計(jì)針對(duì)外顯子組精雕細(xì)琢,僅關(guān)注外顯子區(qū)域,設(shè)計(jì)大小僅為 48M,減少測(cè)序成本。對(duì)于最新的數(shù)據(jù)庫(kù)有全面的外顯子覆蓋,且包含了難以捕獲的區(qū)域。對(duì)于不同 GC 區(qū)域?qū)崿F(xiàn)均一的覆蓋。這一精選版人全外顯子組產(chǎn)品將于 3 月在中國(guó)上市。 |
|
來(lái)自: noyoa > 《二代測(cè)序(NGS)》