ARI,即Adjusted Rand Index(調整蘭德指數),是一種用於評價聚類效果的指標。其計算公式爲:
ARI = (sum_ij(C(n_ij, 2)) - [sum_i(C(a_i, 2)) * sum_j(C(b_j, 2)) / C(n, 2)]) / (1/2 * [sum_i(C(a_i, 2)) + sum_j(C(b_j, 2))] - [sum_i(C(a_i, 2)) * sum_j(C(b_j, 2)) / C(n, 2)])
其中,C(n, k)表示從n個元素中選取k個元素的組合數。n_ij表示聚類結果中第i類與真實類別中第j類共同包含的樣本數量,a_i表示聚類結果中第i類的樣本數量,b_j表示真實類別中第j類的樣本數量,n表示總樣本數。ARI的取值範圍爲-1到1,值越大表示聚類結果越好。
需要注意的是,ARI與平均房價指數(Average Room Rate Index)是兩個不同的概念,後者用於衡量酒店平均房價相對於競爭羣平均房價的變化百分比,計算公式爲:平均房價指數 = 酒店平均房價 / 競爭羣平均房價 × 100%。