본문 바로가기
Python/Pandas

pandas df.sort_values() 함수 활용하기

by PySun 2023. 12. 4.
반응형

df.sort_values() 함수는 Pandas 데이터프레임에서 열의 값을 기준으로 데이터를 정렬하는 데 사용됩니다. 이 함수를 사용하면 데이터프레임의 행을 특정 열의 값을 기준으로 오름차순 또는 내림차순으로 정렬할 수 있습니다.

메서드 구문:

# 함수 구문
df.sort_values(by, ascending=True)

주요 매개변수:

  • by: 정렬 기준이 되는 열의 이름 또는 열의 이름 리스트입니다.
  • ascending: 오름차순으로 정렬할지 여부를 나타내는 부울 값입니다. True로 설정하면 오름차순, False로 설정하면 내림차순으로 정렬됩니다.

예시 코드:

import pandas as pd

# 샘플 데이터프레임 생성
data = {
    'Name': ['Alice', 'Bob', 'Charlie', 'David', 'Eve'],
    'Age': [25, 30, 35, 28, 23],
    'City': ['New York', 'Los Angeles', 'Chicago', 'San Francisco', 'Miami']
}
df = pd.DataFrame(data)

# 'Age' 열을 기준으로 오름차순 정렬
ascending_sort = df.sort_values(by='Age', ascending=True)

# 'Age' 열을 기준으로 내림차순 정렬
descending_sort = df.sort_values(by='Age', ascending=False)

위의 코드에서는 샘플 데이터프레임을 생성하고, df.sort_values() 함수를 사용하여 'Age' 열을 기준으로 오름차순 및 내림차순으로 정렬합니다. 결과로는 정렬된 데이터프레임이 반환됩니다.

df.sort_values() 함수를 사용하여 데이터프레임의 열 값을 기준으로 정렬하면 데이터를 분석하고 시각화할 때 유용합니다.

반응형