FNN模型是一種結合了因子分解機(FM)和多層感知機(MLP)的神經網路結構,旨在提高點擊率預測(CTR)的準確性。以下是FNN模型的主要特點和結構:
特點:
結合FM和MLP: FNN模型利用FM進行特徵交叉,然後通過MLP進行高階特徵組合,從而提高了模型的表達能力。
兩階段訓練: 首先訓練FM模型以獲取初始參數,然後將這些參數作為FNN模型底層參數的初始值。這種方法有助於提高模型的收斂速度並利用FM的特徵表達能力。
激活函式選擇: 在FNN模型中,通常選擇tanh作為激活函式,因為實驗表明它在學習性能上表現良好。
結構:
輸入層(Input layer): 接收原始特徵向量。
FM層(FM layer): 進行特徵交叉操作,輸出特徵交叉向量。
MLP層(MLP layer): 接收FM層輸出的特徵交叉向量,輸出最終預測結果。
存在的問題:
模型能力受限: 由於Embedding參數受FM的影響,模型能力可能受限於FM表徵能力的上限。
訓練過程複雜: 訓練過程分為兩個階段,這可能導致效率不高且過程較複雜。
未充分利用低階特徵: FNN專注於高階組合特徵,但未充分利用低階特徵,這可能限制了模型的泛化能力。
綜上所述,FNN模型通過結合FM和MLP的優勢,提高了CTR預測的準確性。然而,它也存在一些局限性,如模型能力的限制、訓練過程的複雜性以及未充分利用低階特徵等。