GSEA(Gene Set Enrichment Analysis)富集分析是一種基於基因集的富集分析方法,旨在揭示與特定生物學過程、通路或功能相關的基因表達模式。它通過評估預先定義的基因集在基因表達數據中的分布趨勢,從而判斷基因集對於表型的貢獻。GSEA的主要步驟包括:
計算富集得分(Enrichment Score)。ES代表基因集成員在排序列表中的富集程度。當基因集的基因在排序列表的頂部富集時,表示該基因集可能上調;若在底部富集,則可能下調。
估計富集得分的顯著性水平。通過基於表型的排列檢驗來計算觀察到的富集得分出現的可能性。
多重假設檢驗。對每個基因子集計算得到的ES進行標準化,得到Normalized Enrichment Score(NES),並計算假陽性率。
GSEA與傳統的基因差異分析方法(如t檢驗或ANOVA)不同,它關注整個基因集的表達趨勢,而不是單個基因的表達差異。這種方法可以檢測到細微但協調性的變化對生物通路的影響,因此在生物學過程中更為敏感和準確。