mRMR算法,即最大相關性和最小冗餘性算法,是一種用於特徵選擇的算法。它的核心思想是在原始特徵集合中找到與最終輸出結果相關性最大(Max-Relevance),同時這些特徵彼此之間的相關性最小(Min-Redundancy)。
mRMR算法的目的是為了解決通過最大化特徵與目標變數的相關關係度量得到的最好的m個特徵,並不一定會得到最好的預測精度的問題。因為這m個特徵可能存在冗餘特徵的情況,即該特徵所包含的信息能從其他特徵推演出來。例如,對於「面積」這個特徵而言,如果它可以從「長」和「寬」得出,則它是冗餘特徵。因此,mRMR算法就是為了保證在最大相關性的同時,彼此之間又有最小的冗餘性。