箱型圖(Box plot),也稱爲盒須圖或箱線圖,是一種展示一組數據分佈特徵的統計圖表。它主要包含以下幾個部分:
上邊緣和下邊緣。這些不一定是數據集的最大值和最小值,通常表示數據中的非異常值範圍。
箱體。它由數據的下四分位數(Q1)和上四分位數(Q3)繪製而成,包含了數據集的中間50%數據。中位數位於箱體中間。
中位數。表示數據集中的中間值。
上下觸鬚。這些可能表示除了異常值之外的最大值和最小值。
異常值。在箱型圖的上下觸鬚之外的數據點,通常以圓點形式表示,用於標識數據中的異常值。
通過箱型圖,可以比較不同數據集的分佈特徵,識別數據的異常值,以及評估數據的偏斜程度。箱體的寬度表示數據的波動程度,而中位線的位置則可以反映數據的偏斜程度。