勵志

勵志人生知識庫

cart分析

CART(分類和回歸樹)是一種統計學習方法,主要用於構建分類和回歸模型。它通過建立二元分類樹來分析考察對象特定品質,運用二分法,將目標或結果變數拆分到多個分區,以提高模型的預測能力。

CART算法會創建一組「是/否」規則,然後利用這些規則並基於預測變數或輸入設定將目標或結果變數拆分到多個分區。產生的模型以決策樹形式呈現,以展示如何基於輸入設定對目標或結果變數進行分區。Minitab的CART算法可自動查找最優數目的末端節點(也稱為拆分或最終分組),目的就是儘可能地提高模型的預測能力。

CART分析步驟包括:

從根節點開始,從所有可能候選劃分集合中搜尋使不純性降低最大的劃分,然後,使用劃分將節點劃分成兩個節點。

在每個節點上重複上述過程,直到達到預設的終止條件,如節點中的樣本數量過少或特徵數量過少。

完成分析後,CART的輸出包含直觀的可視解釋,因此,即使不是數據科學家,也能從數據中獲得有價值的見解。