盒須圖(箱形圖)是一種展示一組數據分散情況的統計圖,它利用了數據中的五個統計量:最小值、上四分位數、中位數、下四分位數與最大值。盒須圖的五要素包括異常值、上限、下限、上四分位(Q3)、下四分位(Q1)和中位數(Q2)。
中位數:盒須圖中矩形框內的線,表示數據的中心趨勢。
四分位數:矩形框的上邊界是上四分位數(Q3),下邊界是下四分位數(Q1),它們可以用來描述數據的分佈情況。
離散程度:通過觀察盒須的長度可以瞭解數據的離散程度。較長的盒須表示較大的離散程度。
異常值:盒須之外的點被認爲是異常值,可能表示數據中的離羣點或異常情況。
箱形圖的主要優點是不受異常值的影響,能夠直觀地顯示數據的異常值、分佈的離散程度以及數據的對稱性,同時也利於數據的清洗。