四分位距(interquartile range,IQR)是一種統計學中的方法,用於描述數據的離散程度。它通過計算第三四分位數(Q3)和第一四分位數(Q1)之間的差值得到。四分位距的數值越小,表明數據分布越集中,而數值越大則表明數據分布越分散。四分位距不受極值的影響,因此可以用來識別異常值。此外,四分位距的一半等於中值絕對偏差(MAD),這表明對於一個對稱分布的數據集,四分位距與中位數的相關性很高。
四分位距的計算方法是將一組數據從小到大排序,然後分成四等份,每等份之間的數就是四分位數。四分位距的公式為:
四分位距 = Q3 - Q1
四分位距的用途包括:
描述統計學中的數據分散情況:與方差和標準差一樣,四分位距表示數據中各個變數的分散程度。
構建箱形圖:四分位距通常用於構建箱形圖,幫助直觀地展示數據的分布情況。
識別異常值:四分位距可以用來識別異常值,因為它不受極值的影響。
說明中位數的代表程度:四分位距的大小在一定程度上也說明了中位數對一組數據的代表程度。
需要注意的是,四分位距主要用於測度順序數據的離散程度,對於數值型數據可以計算,但不適合分類數據。此外,四分位距的一半等於中值絕對偏差(MAD),這表明對於一個對稱分布的數據集,四分位距與中位數的相關性很高。