增益率的計算可以通過以下公式進行:
增益率 = 增益(A) / I
其中,增益(A) 表示的是在某個屬性A下,數據集S的純度提升程度,計算公式爲:
增益(A) = E(S) - E(S, A)
這裏的 E(S) 表示數據集S的初始熵,而 E(S, A) 表示在屬性A的作用下,數據集S的熵。
I 表示屬性A的信息量,計算公式爲:
I = -∑P(i) * log2(P(i))
其中,P(i)表示屬性A中第i個值的概率。
綜上所述,增益率的計算公式可以表示爲:
增益率 = (E(S) - E(S, A)) / I。