四分位距(IQR,Interquartile Range)的計算方法是將一組數據按照數值大小順序排列後,選擇第三個四分位數(Q3)減去第一個四分位數(Q1)。具體步驟如下:
將數據從小到大排列。
計算四分位數。第一個四分位數(Q1)是數據集中位於25%處的數值,第二個四分位數(Q2,也稱爲中位數)是位於50%處的數值,第三個四分位數(Q3)是位於75%處的數值。
計算四分位距。四分位距等於第三個四分位數(Q3)減去第一個四分位數(Q1),即 \( IQR = Q3 - Q1 \)。
例如,如果有一組數據 \( \{1, 2, 3, 4, 6, 6, 8, 10\} \),首先將其排序爲 \( \{1, 2, 3, 4, 6, 6, 8, 10\} \)。然後計算四分位數:
Q1位於25%處,即 \( (1 + 2 + 3) / 3 = 2.67 \)(取三個數中的中間值),因此 \( Q1 = 2.5 \)。
Q2位於50%處,即 \( (4 + 6) / 2 = 5 \),因此 \( Q2 = 5 \)。
Q3位於75%處,即 \( (6 + 8) / 2 = 7 \),因此 \( Q3 = 7 \)。
最後,計算四分位距:\( IQR = Q3 - Q1 = 7 - 2.5 = 4.5 \)。
四分位距可以簡單衡量一組數據的分散程度,且相比全距(最大值減去最小值),它改進了易受異常值影響的缺陷,因爲異常值不會影響四分位數的計算。