損失函式
二元交叉熵是一種在二分類問題中常用的損失函式,用於評估二分類模型預測結果的好壞程度。其數學表達式為:
\[ Loss = - \frac{1}{N} \sum_{i=1}^{N} y_i \cdot \log(p(y_i)) + (1 - y_i) \cdot \log(1 - p(y_i)) \]
其中,\( y_i \) 是樣本 \( i \) 的真實標籤(0或1),\( p(y_i) \) 是模型對於樣本 \( i \) 屬於正類(例如標籤為1)的機率預測值。損失函式的目標是最小化預測機率與真實標籤之間的差異。當預測正確時,即真實標籤為1且預測機率接近1,或真實標籤為0且預測機率接近0時,損失函式值接近0;而當預測錯誤時,損失函式值會增大。例如,如果真實標籤為1但預測機率接近0,損失函式值會趨近正無窮;反之,如果真實標籤為0但預測機率接近1,損失函式值同樣會趨近正無窮。這種設計使得二元交叉熵能夠有效地懲罰錯誤的預測,並促進模型向正確方向最佳化。