峭度(Kurtosis)是一種反映數據分布特性的統計量,它是歸一化的四階中心矩。峭度係數的計算公式有多種形式,但它們都旨在量化數據分布的峰態。以下是一個常用的峭度計算公式:
峭度計算公式:
kurtosis = \frac{n(n+1)(n-1)(n-2)(n-3)}{\sum_{i=1}^{n}(x_i - \bar{x})^4} - \frac{3(n-1)^2(n-2)(n-3)}{(n-1)(n-2)(n-3)}
其中:
\(n\) 是樣本容量
\(x_i\) 是第 \(i\) 個觀測值
\(\bar{x}\) 是樣本均值
\(s\) 是樣本標準差
物理意義:
當峭度值為 \(3\) 時,表示分布曲線具有正常的峰度,即零峭度。
當標準差小於正常標準差時,即觀測值分散程度較小時,峭度值增大,此時分布曲線峰頂的高度大於正常曲線的峰度,稱為正峭度,\(k > 3\)。
當標準差大於正常標準差時,即觀測值分散程度較大時,峭度值減小,此時分布曲線峰頂的高度小於正常曲線的峰度,稱為負峭度,\(k < 3\)。
總結:
峭度類似於方差,但它通過放大四階矩來強調數據分布的極端值,從而在存在異常值時提供更敏感的度量。這種特性使得峭度在檢測和量化數據中的異常值或極端值方面非常有用。