본문 바로가기
Python/matplotlib

파이썬 matplotlib.pyplot.boxplot 함수 활용하기

by PySun 2024. 10. 26.
반응형

Matplotlib의 boxplot 함수: 데이터 분포 시각화의 힘

파이썬의 Matplotlib 라이브러리는 데이터 시각화를 위한 훌륭한 도구입니다. 그중 pyplot.boxplot 함수는 여러 데이터셋의 분포를 한눈에 볼 수 있도록 도와주는 박스 플롯(box plot)을 생성합니다. 이 포스팅에서는 pyplot.boxplot 함수의 사용법과 함께 다양한 예제를 소개하겠습니다.

boxplot 함수 소개

pyplot.boxplot 함수는 데이터의 중앙값(median), 사분위수(quantiles), 그리고 이상치(outliers)를 시각적으로 표현하는 그래프를 생성합니다. 이를 통해 데이터의 분포를 이해하고, 통계적 특성을 한눈에 파악할 수 있습니다.

함수 시그니처

pyplot.boxplot(x, notch=None, vert=True, patch_artist=False, ...)

매개변수:

  • x: 박스 플롯을 그릴 데이터(리스트 또는 배열 형태).
  • notch: True이면 노치가 있는 박스 플롯을 생성.
  • vert: True이면 세로 박스 플롯, False이면 가로 박스 플롯을 생성.
  • patch_artist: True이면 박스를 색칠된 형태로 표시.

반환 값:

  • 박스 플롯 객체의 리스트를 반환합니다.

사용 예제

기본 예제

다음은 pyplot.boxplot 함수를 사용하여 기본 박스 플롯을 생성하는 예제입니다.

import matplotlib.pyplot as plt
import numpy as np

# 샘플 데이터 생성
data = [np.random.normal(0, std, 100) for std in range(1, 4)]

# 박스 플롯 그리기
plt.boxplot(data)

# 그래프 제목 및 축 레이블 추가
plt.title('Basic Box Plot Example')
plt.xlabel('Data Set')
plt.ylabel('Values')

# 그래프 출력
plt.show()

노치와 색칠된 박스 플롯

노치와 색칠된 박스 플롯을 생성하여 데이터를 더 효과적으로 시각화할 수 있습니다.

import matplotlib.pyplot as plt
import numpy as np

# 샘플 데이터 생성
data = [np.random.normal(0, std, 100) for std in range(1, 4)]

# 박스 플롯 그리기 (노치 및 색칠된 박스)
plt.boxplot(data, notch=True, patch_artist=True,
             boxprops=dict(facecolor='lightblue'))

# 그래프 제목 및 축 레이블 추가
plt.title('Notched and Colored Box Plot Example')
plt.xlabel('Data Set')
plt.ylabel('Values')

# 그래프 출력
plt.show()

결론

pyplot.boxplot 함수는 데이터의 분포를 직관적으로 이해하는 데 큰 도움을 줍니다. 중앙값 및 이상치를 시각적으로 표현하므로 데이터 분석 및 통계학에서 필수적인 도구입니다. 여러분도 다양한 데이터셋을 통해 박스 플롯을 활용해 보세요!

  • 데이터의 분포를 한눈에 파악하고 싶다면 박스 플롯을 활용해보세요!
  • 지금 바로 pyplot.boxplot 함수로 데이터 시각화를 시작해 보세요!
반응형