筆記計劃分為六篇: 第一篇:讀取plink基因型數(shù)據(jù)和表型數(shù)據(jù) 第二篇:對基因型數(shù)據(jù)質(zhì)控:缺失質(zhì)控,maf質(zhì)控,hwe質(zhì)控,樣本質(zhì)控 第三篇:基因型數(shù)據(jù)可視化:kingship,MDS,PCA 第四篇:一般線性模型進(jìn)行GWAS分析(GLM模型) 第五篇:混合線性模型進(jìn)行GWAS分析(MLM模型) 第六篇:TASSEL結(jié)果可視化:QQ plot,曼哈頓圖 已完成前三篇,本篇是第四篇。 1. 將質(zhì)控的plink數(shù)據(jù)和表型數(shù)據(jù)讀入到TASSEL軟件質(zhì)控后的plink數(shù)據(jù)和表型數(shù)據(jù): 「讀取表型數(shù)據(jù)到TASSEL中:」 「讀取基因型數(shù)據(jù)到TASSEL中:」 2. 一般線性模型(GLM)介紹
重點是對每個SNP做回歸分析,提取effect和p-value。 3. 合并數(shù)據(jù)TASSEL分析中,需要將分析的表型和基因型數(shù)據(jù)進(jìn)行合并,合并為一個數(shù)據(jù)框,然后對該數(shù)據(jù)框進(jìn)行分析。 3.1 對基因型數(shù)據(jù)進(jìn)行PCA分析
「PCA分析結(jié)果:」 3.2 將PCA+表型+基因型合并選中三個數(shù)據(jù),然后點擊Data中的Intersect Join,進(jìn)行數(shù)據(jù)合并。 3.3 查看合并后的數(shù)據(jù)可以看到,數(shù)據(jù)中包括ID,PCA及結(jié)果,表型性狀數(shù)據(jù),基因型數(shù)據(jù)。 4. GLM模型選中合并后的書,點擊Analysis --> Association --> GLM 5. GLM結(jié)果查看可以看到,Result中有兩個GLM結(jié)果,第一個為GWAS結(jié)果,第二個為每個SNP的效應(yīng)值情況??吹谝粋€就行。
6. 導(dǎo)出結(jié)果![]() ![]() ![]() ![]() 7. TASSEL中的結(jié)果可視化「QQ圖:」 「曼哈頓圖:」
圖片可以保存到本地。 ok,第四篇搞定了。下一篇是MLM模型的分析,歡迎繼續(xù)關(guān)注。 |
|