LEfSe分析,全稱LDA Effect Size分析,是一種用於發現和解釋高維度生物標識(如基因、通路和分類單元)的分析工具,適用於兩個或多個分組的比較。其特點和步驟如下:
特點。LEfSe強調統計意義和生物相關性,能夠在組與組之間尋找具有統計學差異的生物標識(Biomarker),它主要通過非參數因子Kruskal-Wallis秩和檢驗來檢測不同分組間豐度差異顯著的物種,然後利用Wilcoxon秩和檢驗來檢查顯著差異物種類中的所有亞種比較是否都趨同於同一分類級別,最後用線性判別分析(LDA)對數據進行降維和評估差異顯著物種的影響力。
步驟。LEfSe分析的結果通常包括LDA值分布柱狀圖、進化分支圖和特徵表,這些結果以圖形和表格的形式展示,便於理解和分析。在LDA值分布柱狀圖中,條形圖展示LDA score大於預設值的顯著差異物種,即具有統計學差異的Biomarker,柱狀圖的顏色和長短代表各自的組別和LDA score,即不同組間顯著差異物種的影響程度。進化分支圖則展示了不同分類級別下物種的相對豐度大小和是否為顯著差異物種。特徵表列出了Biomarker名稱、各組分豐度平均值、差異基因或物種富集的組名、LDA值和Kruskal-Wallis秩和檢驗的p值。
綜上所述,LEfSe分析是一種強大的工具,可用於識別和解釋高維度生物數據中的統計學差異顯著的物種或特徵,它在微生物多樣性分析、基因組學和功能基因組學等領域有著廣泛的套用。