偏最小二乘法迴歸分析
PLS(偏最小二乘法迴歸分析)是一種統計分析方法,它結合了多元線性迴歸分析、典型相關分析和主成分分析的特點。在PLS中,被研究的變量稱爲因變量或被解釋變量(Y),而其他用來解釋或說明因變量變化的變量被稱爲自變量或解釋變量(X)。PLS允許在樣本點個數少於變量個數的條件下進行迴歸建模,並且能夠處理自變量之間存在多重相關性的情況。在最終模型中,它會包含原有的所有自變量,並且偏最小二乘迴歸模型更易於辨識系統信息與噪聲,每一箇自變量的迴歸係數也更容易解釋。
PLS通過主成分分析法將多維空間數據的曲線壓縮到較低維的空間數據上,使其原曲線分解爲多種主成分分析曲線,不同的曲線的主成分分別代表不同的主成分和因素間對曲線的貢獻率。選取貢獻率較大的主成分,去除有干擾組分和干擾因素的主成分,僅僅將貢獻率較高的主成分與質量參數進行迴歸。
此外,PLS-DA(偏最小二乘差異分析)是一種有監督的模式,它使用偏最小二乘迴歸建立代謝物表達量與樣本類別之間的關係模型,實現對樣品類別的預測。當無監督(PCA)無法很好地區分組間樣本時,PLS-DA可以實現有效分離,並且所構建的分類預測模型可用於識別更多的樣本類別,這是探索性的PCA方法無法做到的。PLS-DA和OPLS-DA所構建的分類模型中的載荷圖可用於衡量各代謝物組分對樣本分類判別的影響強度和解釋能力,輔助標誌代謝物的篩選。