箱線圖(Box-plot),也稱為盒須圖、盒式圖或箱線圖,是一種用於顯示一組數據分散情況的統計圖。以下是關於箱線圖的詳細介紹:
箱線圖利用數據中的五個統計量:最小值、第一四分位數、中位數、第三四分位數和最大值來描述數據。
第一四分位數(P25),又稱「較小四分位數」,是數據集中排名前25%的數值;中位數(P50),是數據集中排名居中的數值;第三四分位數(P75),又稱「較大四分位數」,是數據集中排名前75%的數值。
箱線圖可以顯示出數據的中心位置、散布範圍以及是否對稱,還可以粗略地觀察數據的分布是否具有對稱性和分散程度,並且可以用於比較多組數據的分布特徵。
箱線圖中的「箱」表示第一四分位數和第三四分位數之間的區域,即IQR(四分位距),而「須」則表示數據的最大值和最小值範圍,這有助於識別數據中的異常值。
此外,在製作箱線圖時,通常還會使用到Excel或其他數據分析軟體中的相關函式來計算四分位數和其他統計量。