AUC(Area Under Curve)是評估分類模型性能的一個重要指標,通常指的是ROC(Receiver Operating Characteristic Curve)曲線下的面積,也可以用於PR(Precision Recall)曲線。AUC的值越接近1,表明分類器的性能越好。
AUC的計算可以通過以下公式進行概括:
AUC=∑i∈positiveclassranki−M(1+M)2M×N
其中,M是正樣本的數量,N是負樣本的數量。這個公式通過統計所有正樣本對中正樣本預測機率大於負樣本預測機率的個數來計算AUC。具體來說,對於每一對正樣本和負樣本,如果正樣本的預測機率大於負樣本的預測機率,則AUC加1;如果兩者機率相等,則AUC加0.5。最後,將得到的AUC值除以總的正負樣本對數,得到最終的AUC值。
例如,如果有4個樣本,其中2個是正樣本,2個是負樣本(M=2,N=2),則總共有4個樣本對。對於每一對樣本,計算它們的預測機率,如果正樣本的預測機率大於負樣本的預測機率,則AUC加1;如果兩者機率相等,則AUC加0.5。最後,將得到的AUC值除以總的正負樣本對數(在這個例子中是4),得到最終的AUC值。