轉(zhuǎn)自:https://blog.csdn.net/yangl7/article/details/109850480;如有侵權(quán),請告知撤回。 GATK是一款強(qiáng)大的數(shù)據(jù)處理軟件,最近在優(yōu)化GWAS流程時遇到一個麻煩事,就是要將各樣品的VCF文件進(jìn)行合并,本來GATK里面有一個可以合并VCF數(shù)據(jù)的命令 CombineGVCFs,可以將所有樣品的VCF合并成一個文件。但是這個命令需要一個一個輸入文件名。 熟悉GWAS的小伙伴應(yīng)該清楚,GWAS項(xiàng)目動輒上百個樣品,讓人一個一個輸入還是很繁瑣的。因此我寫了個shell腳本,能夠快速輸入樣品名稱,并執(zhí)行CombineGVCFs命令。 腳本 Ref_genome="genome.fna" echo 'gatk CombineGVCFs \' > combine.sh #將命令寫在另一個腳本里 echo '-R' ${Ref_genome} '\' >> combine.sh for i in {*.g.vcf.gz}; do echo '--variant '${i}' \' >> combine.sh; done echo '-O all_sample.g.vcf.gz' >> combine.sh; sh combine.sh #執(zhí)行combine.sh腳本 # -R 參考基因組 --variant 輸入變異文件 可以輸入多個文件 -O 輸出文件 來看看執(zhí)行腳本 cat combine.sh 版權(quán)聲明:本文為CSDN博主「穆易青」的原創(chuàng)文章,遵循CC 4.0 BY-SA版權(quán)協(xié)議,轉(zhuǎn)載請附上原文出處鏈接及本聲明。 原文鏈接:https://blog.csdn.net/yangl7/article/details/109850480 |
|