日韩黑丝制服一区视频播放|日韩欧美人妻丝袜视频在线观看|九九影院一级蜜桃|亚洲中文在线导航|青草草视频在线观看|婷婷五月色伊人网站|日本一区二区在线|国产AV一二三四区毛片|正在播放久草视频|亚洲色图精品一区

分享

使用TASSEL學習GWAS筆記(5/6):混合線性模型進行GWAS分析(MLM模型)

 育種數(shù)據(jù)分析 2021-11-18

使用TASSEL學習GWAS筆記(5/6):混合線性模型進行GWAS分析(MLM模型) #2021.8.29

筆記計劃分為六篇:

第一篇:讀取plink基因型數(shù)據(jù)和表型數(shù)據(jù)

第二篇:對基因型數(shù)據(jù)質(zhì)控:缺失質(zhì)控,maf質(zhì)控,hwe質(zhì)控,樣本質(zhì)控

第三篇:基因型數(shù)據(jù)可視化:kingship,MDS,PCA

第四篇:一般線性模型進行GWAS分析(GLM模型) 

第五篇:混合線性模型進行GWAS分析(MLM模型) 

第六篇:TASSEL結果可視化:QQ plot,曼哈頓圖

已完成前四篇,本篇是第五篇。

1. 將質(zhì)控的plink數(shù)據(jù)和表型數(shù)據(jù)讀入到TASSEL軟件

質(zhì)控后的plink數(shù)據(jù)和表型數(shù)據(jù):

「讀取表型數(shù)據(jù)到TASSEL中:」

「讀取基因型數(shù)據(jù)到TASSEL中:」

2. 一般線性模型(GLM)介紹

MLM模型中,將每個SNP作為固定因子進行回歸分析,將親緣關系矩陣(kinship或者A矩陣)作為隨機因子,進行SNP的顯著性檢驗,P值就是GWAS分析的p-value,effect就是SNP的effect值。如果有其它因素需要考慮,就放到協(xié)變量里面,比如性別,PCA,Q矩陣等。MLM和GLM不同的就是它考慮kinship的影響。

重點是對每個SNP做回歸分析,提取effect和p-value。

3. 合并數(shù)據(jù)

TASSEL分析中,需要將分析的表型和基因型數(shù)據(jù)進行合并,合并為一個數(shù)據(jù)框,然后對該數(shù)據(jù)框進行分析。

3.1 對基因型數(shù)據(jù)進行PCA分析

選中qc_plink基因型數(shù)據(jù),點擊菜單 Analysis --> Relatedness --> PCA,然后點擊確定即可。

「PCA分析結果:」

3.2 根據(jù)基因型數(shù)據(jù)計算kinship

選中基因型數(shù)據(jù),點擊菜單 Analysis --> Relatedness --> Kinship默認選項即可:查看kinship:

3.3 將PCA+表型+基因型合并

選中三個數(shù)據(jù),然后點擊Data中的Intersect Join,進行數(shù)據(jù)合并。注意,不要講kinship放進去。

3.3 查看合并后的數(shù)據(jù)

可以看到,數(shù)據(jù)中包括ID,PCA及結果,表型性狀數(shù)據(jù),基因型數(shù)據(jù)。

4. MLM模型

選中合并后的數(shù)據(jù) + kinship,點擊Analysis --> Association --> MLM

點擊默認Run運行即可。

5. MLM結果查看

可以看到,Result中有兩個MLM結果,第一個為GWAS結果,第二個為每個SNP的效應值情況??吹谝粋€就行。

因為這是多個性狀的分析,所以所有結果放在了一起。

  • 第一列為性狀,這里包括三個性狀,在進行作圖時需要將數(shù)據(jù)分開
  • 第二列為SNP名稱
  • 第三列為染色體名稱
  • 第四列為SNP的物理位置
  • 第五列為df
  • 第六列為F檢驗結果
  • 第七列為p值
  • ……

6. 導出結果

查看結果:

7. TASSEL中的結果可視化

「QQ圖:」

「曼哈頓圖:」

這里,曼哈頓圖需要指定性狀,這里我們選擇EarDia這個性狀進行可視化:

圖片可以保存到本地。

ok,第五篇搞定了。下一篇是GWAS結果放到R語言中可視化,歡迎繼續(xù)關注。

    轉(zhuǎn)藏 分享 獻花(0

    0條評論

    發(fā)表

    請遵守用戶 評論公約

    類似文章