使用TASSEL學習GWAS筆記(5/6):混合線性模型進行GWAS分析(MLM模型) #2021.8.29筆記計劃分為六篇: 第一篇:讀取plink基因型數(shù)據(jù)和表型數(shù)據(jù) 第二篇:對基因型數(shù)據(jù)質(zhì)控:缺失質(zhì)控,maf質(zhì)控,hwe質(zhì)控,樣本質(zhì)控 第三篇:基因型數(shù)據(jù)可視化:kingship,MDS,PCA 第五篇:混合線性模型進行GWAS分析(MLM模型) 第六篇:TASSEL結果可視化:QQ plot,曼哈頓圖 已完成前四篇,本篇是第五篇。 1. 將質(zhì)控的plink數(shù)據(jù)和表型數(shù)據(jù)讀入到TASSEL軟件質(zhì)控后的plink數(shù)據(jù)和表型數(shù)據(jù): 「讀取表型數(shù)據(jù)到TASSEL中:」 「讀取基因型數(shù)據(jù)到TASSEL中:」 2. 一般線性模型(GLM)介紹MLM模型中,將每個SNP作為固定因子進行回歸分析,將親緣關系矩陣(kinship或者A矩陣)作為隨機因子,進行SNP的顯著性檢驗,P值就是GWAS分析的p-value,effect就是SNP的effect值。如果有其它因素需要考慮,就放到協(xié)變量里面,比如性別,PCA,Q矩陣等。MLM和GLM不同的就是它考慮kinship的影響。 重點是對每個SNP做回歸分析,提取effect和p-value。 3. 合并數(shù)據(jù)TASSEL分析中,需要將分析的表型和基因型數(shù)據(jù)進行合并,合并為一個數(shù)據(jù)框,然后對該數(shù)據(jù)框進行分析。 3.1 對基因型數(shù)據(jù)進行PCA分析
「PCA分析結果:」 3.2 根據(jù)基因型數(shù)據(jù)計算kinship選中基因型數(shù)據(jù),點擊菜單 Analysis --> Relatedness --> Kinship 3.3 將PCA+表型+基因型合并選中三個數(shù)據(jù),然后點擊Data中的Intersect Join,進行數(shù)據(jù)合并。注意,不要講kinship放進去。 3.3 查看合并后的數(shù)據(jù)可以看到,數(shù)據(jù)中包括ID,PCA及結果,表型性狀數(shù)據(jù),基因型數(shù)據(jù)。 4. MLM模型選中合并后的數(shù)據(jù) + kinship,點擊Analysis --> Association --> MLM 點擊默認Run運行即可。 5. MLM結果查看可以看到,Result中有兩個MLM結果,第一個為GWAS結果,第二個為每個SNP的效應值情況??吹谝粋€就行。 因為這是多個性狀的分析,所以所有結果放在了一起。
6. 導出結果![]()
![]() 7. TASSEL中的結果可視化「QQ圖:」 「曼哈頓圖:」 這里,曼哈頓圖需要指定性狀,這里我們選擇EarDia這個性狀進行可視化: 圖片可以保存到本地。 ok,第五篇搞定了。下一篇是GWAS結果放到R語言中可視化,歡迎繼續(xù)關注。 |
|
來自: 育種數(shù)據(jù)分析 > 《待分類》