日韩黑丝制服一区视频播放|日韩欧美人妻丝袜视频在线观看|九九影院一级蜜桃|亚洲中文在线导航|青草草视频在线观看|婷婷五月色伊人网站|日本一区二区在线|国产AV一二三四区毛片|正在播放久草视频|亚洲色图精品一区

分享

使用GATK CombineGVCFs命令批量合并vcf文件

 頭頭了不起 2021-11-23

轉(zhuǎn)自:https://blog.csdn.net/yangl7/article/details/109850480;如有侵權(quán),請告知撤回。

GATK是一款強(qiáng)大的數(shù)據(jù)處理軟件,最近在優(yōu)化GWAS流程時遇到一個麻煩事,就是要將各樣品的VCF文件進(jìn)行合并,本來GATK里面有一個可以合并VCF數(shù)據(jù)的命令 CombineGVCFs,可以將所有樣品的VCF合并成一個文件。但是這個命令需要一個一個輸入文件名。

熟悉GWAS的小伙伴應(yīng)該清楚,GWAS項(xiàng)目動輒上百個樣品,讓人一個一個輸入還是很繁瑣的。因此我寫了個shell腳本,能夠快速輸入樣品名稱,并執(zhí)行CombineGVCFs命令。

腳本

Ref_genome="genome.fna"

echo 'gatk CombineGVCFs \' > combine.sh #將命令寫在另一個腳本里

echo '-R' ${Ref_genome} '\' >> combine.sh

for i in {*.g.vcf.gz};

do

echo '--variant '${i}' \' >> combine.sh;

done

echo '-O all_sample.g.vcf.gz' >> combine.sh;

sh combine.sh #執(zhí)行combine.sh腳本

# -R 參考基因組 --variant 輸入變異文件 可以輸入多個文件 -O 輸出文件

來看看執(zhí)行腳本

cat combine.sh

版權(quán)聲明:本文為CSDN博主「穆易青」的原創(chuàng)文章,遵循CC 4.0 BY-SA版權(quán)協(xié)議,轉(zhuǎn)載請附上原文出處鏈接及本聲明。

原文鏈接:https://blog.csdn.net/yangl7/article/details/109850480

    本站是提供個人知識管理的網(wǎng)絡(luò)存儲空間,所有內(nèi)容均由用戶發(fā)布,不代表本站觀點(diǎn)。請注意甄別內(nèi)容中的聯(lián)系方式、誘導(dǎo)購買等信息,謹(jǐn)防詐騙。如發(fā)現(xiàn)有害或侵權(quán)內(nèi)容,請點(diǎn)擊一鍵舉報(bào)。
    轉(zhuǎn)藏 分享 獻(xiàn)花(0

    0條評論

    發(fā)表

    請遵守用戶 評論公約

    類似文章 更多