본문 바로가기
Python/Pandas

pandas.rank로 데이터 순위 매기기

by PySun 2025. 6. 16.
반응형

Pandas rank 함수: 데이터의 순위를 매기는 방법

데이터 분석에 있어 데이터의 순위를 매기는 것은 매우 중요한 작업입니다. Pandas 라이브러리의 rank 함수는 이러한 순위를 쉽게 매길 수 있도록 도와줍니다. 이번 포스팅에서는 pandas.rank 함수의 사용법과 함께 간단한 예제를 통해 데이터를 어떻게 효과적으로 정리할 수 있는지 살펴보겠습니다.

pandas.rank 함수 소개

pandas.rank 함수는 주어진 데이터에 따라 순위를 매깁니다. 데이터가 동일한 경우, 사용자 정의 옵션에 따라 평균, 최솟값, 최댓값 등 다양한 방식으로 순위를 매길 수 있습니다. 이 기능은 데이터의 상대적 위치를 이해하는 데 매우 유용합니다.

함수 시그니처

DataFrame.rank(method='average', ascending=True, axis=0)

매개변수:

  • method: 순위를 매기는 방법을 정의합니다. (default: 'average')
  • ascending: 오름차순 또는 내림차순으로 정렬할지를 결정합니다. (default: True)
  • axis: 순위를 매길 축(axis)을 선택합니다. (default: 0, 행 기준)

반환 값:

  • 순위가 매겨진 데이터가 반환됩니다.

사용 예제

기본 예제

아래는 pandas.rank 함수를 사용하여 데이터 시리즈에 순위를 매기는 기본 예제입니다.

import pandas as pd

# 데이터 시리즈 생성
data = pd.Series([10, 20, 20, 30, 40])

# 순위 매기기
ranked = data.rank()

print("Data:\n", data)
print("Ranked:\n", ranked)
# 출력:
# Data:
# 0    10
# 1    20
# 2    20
# 3    30
# 4    40
# Ranked:
# 0    1.0
# 1    2.5
# 2    2.5
# 3    4.0
# 4    5.0

다양한 방법으로 순위 매기기

순위를 매길 방법을 지정하면 순위의 결과가 달라집니다. 다음 예제를 통해 다양한 방법으로 순위를 매기는 과정을 살펴보겠습니다.

import pandas as pd

# 데이터 시리즈 생성
data = pd.Series([10, 20, 20, 30, 40])

# 평균 방법으로 순위 매기기
average_rank = data.rank(method='average')
# 최댓값 방법으로 순위 매기기
max_rank = data.rank(method='max')
# 최솟값 방법으로 순위 매기기
min_rank = data.rank(method='min')

print("Average Rank:\n", average_rank)
print("Max Rank:\n", max_rank)
print("Min Rank:\n", min_rank)
# 출력:
# Average Rank:
# 0    1.0
# 1    2.5
# 2    2.5
# 3    4.0
# 4    5.0
#
# Max Rank:
# 0    1.0
# 1    2.0
# 2    2.0
# 3    4.0
# 4    5.0
#
# Min Rank:
# 0    1.0
# 1    2.0
# 2    2.0
# 3    4.0
# 4    5.0

결론

pandas.rank 함수를 통해 데이터에 간편하게 순위를 매길 수 있으며, 여러 방식으로 순위를 조정할 수 있습니다. 이러한 기능은 데이터를 정리하고 해석하는 데 큰 도움이 됩니다.

  • 지금 바로 pandas.rank 함수를 사용하여 여러분의 데이터를 더욱 체계적으로 정리해 보세요!
  • 순위 매기기를 통해 데이터 분석을 더욱 깊이 있게 만들어보세요!
반응형