大家好,我是鄧飛。 對于vcf文件和plink文件是經(jīng)常用的文件,對于基因型數(shù)據(jù)的處理,一般分為:
今天介紹一下vcf文件的三個處理方法:
用到的軟件是 1. 數(shù)據(jù)描述數(shù)據(jù)使用GWAS-Cookbook中的GWASdat1中的數(shù)據(jù),將數(shù)據(jù)變?yōu)関cf格式。
將plink的二進制文件,變?yōu)関cf的代碼:
![]() 2. vcf文件修改染色體名稱
整理好的對應關系:
代碼:
修改后的結果:
3. 修改樣本的名稱樣本對應關系txt文件整理:
對應關系文件內容:
代碼:
修改后的vcf: ![]() 4. 提取vcf樣本代碼:
提取后的文件: ![]() 搞定! 想要更好的學習和交流,快來加入飛哥的知識星球,這是一個生物統(tǒng)計+數(shù)量遺傳學+GWAS+GS的社區(qū),在這里你可以向飛哥提問、幫你制定學習計劃、跟著飛哥一起做實戰(zhàn)項目,沖沖沖。點擊這里加入吧:飛哥的學習圈子 分割線 大家好,我是鄧飛,一個持續(xù)分享的農(nóng)業(yè)數(shù)據(jù)分析師,這里我將自己公眾號的干貨內容挑重點羅列一下,方便大家閱讀和使用。 1,GWAS學習教程(快來領取 | 飛哥的GWAS分析教程更新啦),這個pdf是我將公眾號的內容進行了匯總,更方便從頭學習GWAS分析,里面配套了數(shù)據(jù)、代碼和講解,屬于干貨推薦的Number 1。 2,農(nóng)學人如何入門數(shù)據(jù)分析資料匯總(飛哥匯總 | 入門數(shù)據(jù)分析資源推薦),里面推薦了免費的教程,包括編程、統(tǒng)計和專業(yè)書籍。 3,數(shù)量遺傳學電子書下載(數(shù)量遺傳學,分享幾本書的電子版) 4,R語言電子書線上書籍推薦(學習R語言這幾本電子書就夠了!) |
|
來自: 育種數(shù)據(jù)分析 > 《待分類》