NMF(Non-negative Matrix Factorization,非負矩陣分解)是一種矩陣分解方法,旨在將一個非負矩陣分解為兩個非負矩陣的乘積。其目標是通過找到兩個非負矩陣W和H,使得它們的乘積儘可能接近原始的非負矩陣V,其中W和H的乘積維度與V相同。
NMF的套用廣泛,包括圖像分析、文本挖掘和語音處理等領域。在圖像處理中,NMF可以用於特徵提取和降維;在文本挖掘中,NMF可以用於主題模型構建,通過找到文檔和關鍵字之間的機率關係來揭示主題。
NMF的數學模型可以表示為V=WH,其中V是一個非負矩陣,W被稱為基矩陣,H被稱為係數矩陣。在文本主題模型中,W中的每個列向量代表一個主題,而H表示每個主題與每個詞之間的機率關係。
NMF的算法思想是通過構造一個代價函式(如2範數距離或KL散度),並使用最佳化方法(如拉格朗日KKT方法)來尋找最優的W和H,使得V和WH之間的差異儘可能小。這個過程通常涉及到疊代最佳化,直到找到滿足條件的穩定點。
NMF的一個關鍵特點是其非負約束條件,這意味著分解得到的W和H矩陣的所有元素都必須是非負的。這種非負性質使得NMF在解釋性和套用方面具有獨特的優勢。