본문 바로가기
Python/numpy

파이썬 numpy.median 함수 활용하기

by PySun 2024. 6. 21.
반응형

Numpy Median 함수 소개:

Numpy의 `numpy.median` 함수는 배열의 중앙값을 계산하는 함수입니다. 중앙값은 주어진 데이터를 크기 순서대로 정렬했을 때 중간에 위치한 값으로, 이 함수는 주어진 배열의 중앙값을 반환합니다. 중앙값은 이상치에 민감하지 않으므로 데이터의 대표값을 측정하는 데 유용합니다.

기본 사용법:

`numpy.median` 함수의 기본 사용법은 다음과 같습니다.

import numpy as np

# 1차원 배열의 중앙값 계산
array = np.array([1, 2, 3, 4, 5])
median_value = np.median(array)
print("배열의 중앙값:", median_value)

위 예시 코드에서 `np.median(array)`는 주어진 1차원 배열의 중앙값을 계산합니다.

예시 코드:

  • 다차원 배열의 중앙값 계산:
# 다차원 배열의 중앙값 계산
array_2d = np.array([[1, 2], [3, 4]])
array_3d = np.array([[[1, 2], [3, 4]], [[5, 6], [7, 8]]])

median_2d = np.median(array_2d)  # 모든 원소의 중앙값
median_2d_axis_0 = np.median(array_2d, axis=0)  # 각 열의 중앙값
median_2d_axis_1 = np.median(array_2d, axis=1)  # 각 행의 중앙값

median_3d = np.median(array_3d)  # 모든 원소의 중앙값
median_3d_axis_0 = np.median(array_3d, axis=0)  # 각 깊이 차원(axis=0)의 중앙값
median_3d_axis_1 = np.median(array_3d, axis=1)  # 각 행의 중앙값
median_3d_axis_2 = np.median(array_3d, axis=2)  # 각 열의 중앙값

print("2차원 배열 중앙값:", median_2d)
print("2차원 배열 열별 중앙값:", median_2d_axis_0)
print("2차원 배열 행별 중앙값:", median_2d_axis_1)

print("3차원 배열 중앙값:", median_3d)
print("3차원 배열 깊이별 중앙값:", median_3d_axis_0)
print("3차원 배열 행별 중앙값:", median_3d_axis_1)
print("3차원 배열 열별 중앙값:", median_3d_axis_2)

결론:

`numpy.median` 함수는 다차원 배열의 중앙값을 계산하는 유용한 함수로, 이상치에 민감하지 않아 데이터의 대표값을 측정하는 데에 활용됩니다. 다양한 축(axis)을 지정하여 배열의 중앙값을 계산할 수 있어서 데이터의 특성을 다양하게 분석할 수 있습니다. 예시 코드를 통해 `numpy.median` 함수의 활용법을 익혀보세요.

반응형