Z-score公式是用於衡量一個數據點相對於數據集平均值的標準化值,其基本形式為:
z=x−μσz = \frac{x - \mu}{\sigma}z=σx−μ
這裡,x 是數據點,μ 是數據的平均值(mean),σ 是數據的標準差(standard deviation)。
如果數據是來自一個大總體(即總體均值和總體標準差已知),則直接使用這些值。如果數據來自樣本,那麼可以使用樣本均值(x¯\overline{x}x¯)和樣本標準差(S)來估計總體參數,此時公式變為:
z_i = \frac{x_i - \overline{x}}{S}z_i=Sxi−x
這個公式告訴我們在標準差單位下,一個數據點距離平均點的位置,即多少個標準差。這對於比較不同數據集、不同時間點的數據或者不同群體的數據非常有用。