KPCA(核主成分分析)是一種非線性數據處理方法,其核心思想是通過一個非線性映射把原始空間的數據投影到高維特徵空間,然後在高維特徵空間中進行基於主成分分析(PCA)的數據處理。
KPCA算法的基本步驟包括:
通過核函式計算樣本間的相似度矩陣K,其中K_{ij} = k(x_i, x_j),其中x_i和x_j是原空間的樣本,k(.,.)是核函式。
計算K的特徵值,並從大到小進行排列。找到由特徵值對應的特徵向量αl,並對αl進行歸一化,使得∣∣αl∣∣=1。
原始樣本在第個非主成分下的坐標為:Zl(x) = ∑i=1nαilk(xi, x),其中x是第i個樣本。
如果選擇m個非線性主成分,則樣本x在前m個非線性主成分上的坐標就構成了樣本在新空間中的表示。
KPCA是PCA算法的非線性拓展,可以處理維度之間存在非線性相關性的數據。