日韩黑丝制服一区视频播放|日韩欧美人妻丝袜视频在线观看|九九影院一级蜜桃|亚洲中文在线导航|青草草视频在线观看|婷婷五月色伊人网站|日本一区二区在线|国产AV一二三四区毛片|正在播放久草视频|亚洲色图精品一区

分享

LD衰減圖繪制--PopLDdecay

 育種數(shù)據(jù)分析 2022-10-25 發(fā)布于河南

大家好,我是鄧飛。

LD衰減圖,可以形象的查看群體LD衰減的情況。LD衰減是由于連鎖不平衡所致,LD衰減速度在不同物種或者不同亞種中差異不同,通常用LD衰減到一般的距離來作為群體的衰減距離(還有其它計算方法),如果LD衰減很快,則在進行GWAS分析時需要更多的位點才能達到一定的精度。(計算群體GWAS分析所需要的最少SNP個數(shù)

另外,LD衰減也可以反應(yīng)群體受選擇的情況,一般來說,野生群體比馴化改良群體LD衰減快,異花授粉比自花授粉植物L(fēng)D衰減快。

LD圖分為單個群體和多個群體的圖,今天使用軟件PopLDdecay來實現(xiàn)一下。這個軟件需要Linux系統(tǒng)。

目標(biāo)圖:

1. 數(shù)據(jù)

基因型數(shù)據(jù)是vcf數(shù)據(jù),plink格式的數(shù)據(jù)可以轉(zhuǎn)化為vcf數(shù)據(jù)。

  • plink數(shù)據(jù)
  • vcf數(shù)據(jù)
$ ls hebing.ped hebing.map
hebing.map  hebing.ped

上面示例中用的是plink數(shù)據(jù),這里轉(zhuǎn)化為vcf格式的數(shù)據(jù):

plink --file hebing --recode vcf-iid --allow-extra-chr --chr-set 40 --out file

結(jié)果:

$ ls file.vcf
file.vcf

2. PopLDdecay軟件安裝

官網(wǎng):https://github.com/BGI-shenzhen/PopLDdecay

安裝方法:

        git clone https://github.com/hewm2008/PopLDdecay.git 
        cd PopLDdecay; chmod 755 configure; ./configure;
        make;
        mv PopLDdecay  bin/;    #     [rm *.o]

測試:

$ PopLDdecay

 Usage: PopLDDecay -InVCF  <in.vcf.gz>  -OutStat <out.stat>

  -InVCF         <str>     Input SNP VCF Format
  -InGenotype    <str>     Input SNP Genotype Format
  -OutStat       <str>     OutPut Stat Dist ~ r^2/D' File

  -SubPop        <str>     SubGroup Sample File List[ALLsample]
  -MaxDist       <int>     Max Distance (kb) between two SNP [300]
  -MAF           <float>   Min minor allele frequency filter [0.005]
  -Het           <float>   Max ratio of het allele filter [0.88]
  -Miss          <float>   Max ratio of miss allele filter [0.25]
  -EHH           <str>     To Run EHH Region decay set StartSite [NA]
  -OutFilterSNP            OutPut the final SNP to calculate
  -OutType       <int>     1: R^2 result 2: R^2 & D' result 3:PairWise LD Out[1]
                           See the Help for more OutType [1-8] details

  -help                    Show more help [hewm2008 v3.40]

顯示安裝完成

3. 單個品種的繪制LD圖

~/bin/PopLDdecay -InVCF file.vcf -OutStat LDdecay
~/bin/Plot_OnePop.pl -inFile LDdecay.stat.gz --output re1 -bin1 10 -bin2 100

這里面,我用的是SNP數(shù)據(jù)位點較少,所以曲線不平滑,可以修改bin2=500,在進行繪圖:

~/bin/Plot_OnePop.pl -inFile LDdecay.stat.gz --output re2 -bin1 10 -bin2 500

4. 多品種繪制LD圖

如果要運行A,B,C三個品種的LD圖,先要把ID整理為三個文件:

  • A.txt
  • B.txt
  • C.txt

文件:

$ ls *txt
A.txt  B.txt  C.txt  total_name.txt

分別針對于每個品種,計算:

~/bin/PopLDdecay -InVCF file.vcf -OutStat A.stat.gz -SubPop A.txt
~/bin/PopLDdecay -InVCF file.vcf -OutStat B.stat.gz -SubPop B.txt
~/bin/PopLDdecay -InVCF file.vcf -OutStat C.stat.gz -SubPop C.txt


結(jié)果文件:

$ ls *stat.gz
A.stat.gz  B.stat.gz  C.stat.gz

生成multi.list,格式為兩列,第一列為文件名稱,第二列為品種名稱,內(nèi)容為:

$ cat multi.list
A.stat.gz A
B.stat.gz B
C.stat.gz C


作圖:

perl ~/bin/Plot_MultiPop.pl -inList multi.list --output re3 -bin1 10 -bin2 500


    轉(zhuǎn)藏 分享 獻花(0

    0條評論

    發(fā)表

    請遵守用戶 評論公約

    類似文章 更多