箱線圖(Box plot)是一種用於顯示數據分佈的圖形表示,它由以下幾個部分組成:
箱子:代表四分位距(IQR),即第三四分位數(Q75)和第一四分位數(Q25)之間的差異。箱子內的線表示中位數。
上須和下須:分別從箱子的上邊和下邊延伸到離羣點之前的最大值和最小值。上須延伸到數據的最大值(Max),下須延伸到數據的最小值(Min)。
異常值:任何大於Q75+1.5*IQR或小於Q25-1.5*IQR的值被視爲異常值。如果數據值大於Q75+3*IQR或小於Q25-3*IQR,則被視爲極值。
偏度:通過對稱性可以判斷數據的分佈情況。中位數在箱子中間表示對稱分佈,中位數更靠近下四分位數表示右偏分佈,中位數更靠近上四分位數表示左偏分佈。
箱線圖的組成部分有助於理解數據的集中趨勢、離散程度、偏度以及是否存在異常值。它提供了一箇概覽,使得研究者可以快速地獲取關於數據分佈的重要信息。