"Dấu chấm" ở cuối ô mẫu thể hiện các ngoại lệ. Có một số quy tắc khác nhau để xác định xem một điểm có phải là ngoại lệ hay không, nhưng phương pháp R và sử dụng ggplot là "quy tắc 1.5". Nếu một điểm dữ liệu là:
- ít hơn Q1 - 1,5 * IQR
- lớn hơn Q3 + 1,5 * IQR
thì thời điểm đó được phân loại như là một "outlier". Râu được định nghĩa là:
thượng râu ria = min (max (x), Q_3 + 1,5 * IQR)
râu ria thấp = max (min (x), Q_1 - 1,5 * IQR)
trong đó IQR = Q_3 - Q_1, chiều dài hộp. Vì vậy, râu trên nằm ở nhỏ hơn giá trị x tối đa và Q_3 + 1,5 IQR, trong khi râu thấp hơn nằm ở lớn hơn giá trị x nhỏ nhất và Q_1 - 1,5 IQR.
thông tin bổ sung
- Xem wikipedia boxplot trang cho các quy tắc outlier thay thế.
- Thực tế có nhiều cách tính toán lượng tử. Có một cái nhìn tại `? Quantile cho mô tả của chín các phương pháp khác nhau.
Ví dụ
Hãy xem xét ví dụ sau
> set.seed(1)
> x = rlnorm(20, 1/2)#skewed data
> par(mfrow=c(1,3))
> boxplot(x, range=1.7, main="range=1.7")
> boxplot(x, range=1.5, main="range=1.5")#default
> boxplot(x, range=0, main="range=0")#The same as range="Very big number"
này cho cốt truyện sau:
Như chúng ta đã giảm khoảng 1,7-1,5 chúng tôi sẽ giảm chiều dài của râu ria. Tuy nhiên, range=0
là trường hợp đặc biệt - nó tương đương với "dải = vô cùng"
Xem các trang trợ giúp cho '? Boxplot' hoặc'? Boxplot.stats'. ggplot sử dụng các hàm R tiêu chuẩn cho các phép tính này. – csgillespie
Trong ggplot2, râu trên được tính là max (x [x cho ria mép thấp hơn. –
TemplateRex