PSM分析主要指的是傾向評分匹配(Propensity Score Matching, PSM),這是一種統計學方法,用於處理觀察研究(Observational Study)的數據。PSM的主要目的是減少數據偏差和混雜變數的影響,以便對實驗組和對照組進行更合理的比較。這種方法最早由Paul Rosenbaum和Donald Rubin在1983年提出,一般常用於醫學、公共衛生、經濟學等領域。
PSM的核心思想是從未受干預的用戶群體中,找到和干預對象一模一樣的用戶,這樣就可以把因果效應歸因到干預上。每個樣本有多個特徵,如用戶畫像特徵、行為特徵等,如果每個特徵都進行匹配,則維度會很多,匹配也會很困難。因此可以引進傾向得分P(x)來代替,這樣就可以用一維變數進行匹配,從而大大降低匹配的複雜度。
PSM通過統計學模型對每個觀測對每個協變數的綜合傾向性得分,再按照傾向性得分是否接近進行匹配。具體的匹配方法有1對1匹配和1對多匹配,以及最鄰近匹配等。
總的來說,PSM分析是一種重要的統計學方法,它可以幫助我們更好地理解和評估干預(如政策、培訓、產品定價等)的效果,尤其是在無法進行隨機對照實驗的情況下。