Grad-CAM(Gradient-weighted Class Activation Mapping)是一種用於解釋深度神經網路決策的可視化技術。它通過計算並映射最後一個卷積層中每個特徵圖對圖片類別的權重,來顯示網路對圖像中哪些區域敏感。Grad-CAM的基本原理如下:
計算權重。在神經網路進行前向傳播時,記錄最後一個卷積層的特徵圖(也稱為激活圖)和網路的預測值。在反向傳播過程中,以網路預測的類別作為損失函式,計算該損失函式關於最後一個卷積層特徵圖的梯度。
特徵圖加權。將這些梯度通過全局平均池化處理,得到每個特徵圖的權重。這些權重反映了特徵圖對於最終預測類別的貢獻程度。
生成熱力圖。將加權後的特徵圖進行ReLU激活,以保留對最終預測有正貢獻的區域,然後上採樣到原始圖片的大小,形成熱力圖。熱力圖中的每個像素表示網路對圖像中相應區域的重要程度評估。
通過這種方式,Grad-CAM能夠直觀地展示出模型在做出分類決策時關注的是圖像中的哪些區域,從而提高了模型決策的可解釋性。