데이터를 선택한 후 삽입-차트에서 그림처럼 상자 수염 그림을 선택하면 손쉽게 box plot 차트를 그릴 수 있다.
아래 그림은 미국 주식 리얼티인컴의 종가를 1994년 10월 18일부터 2023년 4월 3일까지 box plot 차트로 그린 것이다. 이 차트는 아래와 같이 읽을 수 있다.
최대값 : 72.43412781
데이터를 일렬로 세웠을 때 상위 25% 값(Q3, Upper quartile) : 38.60832214
평균값 : 22.10417881
중간값(Q2, Median) : 12.23393345
데이터를 일렬로 세웠을 때 상위 75% 값(Q1, Lower quartile) : 4.541092396
최솟값 : 1.295538068
Q3에서 Q1까지의 길이를 사분범위 IQR이라고 한다.
Q3+1.5*IQR이 넘는 값이나 Q1-1.5*IQR의 값은 outlier라고 하며 box plot의 ┬와 ┴ 사이에 위치하지 않는다. 이때 최솟값 위치에는 outlier 값이 빠진 가장 작은 수가 마크된다.
반응형