LIME(局部可解釋性模型解釋)是一種機器學習算法,用於解釋深度學習模型的決策結果。LIME的主要思想是在輸入數據周圍構建一個線性模型來近似深度學習模型的決策過程。該算法使用局部加權回歸來確定每個特徵的影響,並生成一組局部解釋。
LIME算法的步驟包括:
確定目標函式。
選取關注的樣本點。
確定一個相似度計算方式,以及要選取的目標解釋特徵。
對樣本點周圍進行擾動,按照它們到x的距離賦予樣本權重。
用原模型對這些樣本進行預測,並訓練一個線性模型在X的附近對原模型近似。
LIME算法可以套用到多個場景中,不僅僅可以對卷積神經網路中的圖像分類,而且還可以套用到自然語言處理(NLP)當中。LIME算法與模型無關,他的可用性強。LIME算法可以給出一個相關的可信度量,可以作為模型可靠的評估指標。LIME還可以對訓練的模型的特徵數據中未出現過特徵數據進行解釋。
然而,LIME算法在發生數據擾動時,樣本服從高斯分布,忽略了特徵之間的相關性。LIME算法速度慢,LIME在完成採樣完成後,採樣出來的圖片都要經過原模型預測的結果,所需的時間複雜度比較高。