GWAS分析,全稱全基因組關聯分析,是一種研究表型(關注的性狀)與基因型(遺傳變異,如單核苷酸多態性SNP)之間關係的方法,目的是找到影響表型差異的遺傳因素。
GWAS分析的過程包括數據過濾、統計模型套用和結果解讀。數據過濾是為了提高分析的準確性和可靠性,例如通過過濾掉缺失率高的SNP、不符合哈迪-溫伯格平衡的位點、次等位基因頻率過低的位點等。在統計模型方面,分類性狀(如抗病性、顏色)和連續性狀(如株高、體重)分別採用不同的模型進行分析,如logistic回歸模型和GLM(一般線性模型)、MLM(混合線性模型)等。GWAS分析不僅適用於人類疾病的研究,也可用於動植物品種的遺傳改良。
此外,GWAS的局限性包括難以區分因果變異和非因果變異、對樣本量和統計力量的需求高等,因此常與其他技術如TWAS(全轉錄組關聯分析)結合使用,以深入研究基因調控機制和疾病易感基因。