본문 바로가기
Python/Pandas

pandas grouped.aggregate() 함수 활용하기

by PySun 2023. 12. 12.
반응형

grouped.aggregate() 함수는 Pandas에서 그룹화된 데이터에 대해 집계 함수를 적용하는 데 사용됩니다. 이 함수를 사용하면 그룹화된 데이터에서 다양한 집계 연산을 수행할 수 있습니다.

메서드 구문:

# 함수 구문
grouped.aggregate(func)

주요 매개변수:

  • func: 그룹화된 데이터에 적용할 집계 함수입니다. 이 함수는 문자열로 함수 이름을 지정하거나, 직접 사용자 정의 함수를 전달할 수 있습니다.

예시 코드:

import pandas as pd

# 샘플 데이터프레임 생성
data = {
    'Category': ['A', 'B', 'A', 'B', 'A', 'C'],
    'Value': [10, 20, 15, 25, 30, 5]
}
df = pd.DataFrame(data)

# 'Category' 열을 기준으로 데이터프레임을 그룹화
grouped = df.groupby('Category')

# 그룹별 합계와 평균을 함께 계산
result = grouped['Value'].aggregate(['sum', 'mean'])

위의 코드에서는 샘플 데이터프레임을 생성하고, df.groupby() 함수를 사용하여 'Category' 열을 기준으로 데이터를 그룹화합니다. 그런 다음, grouped['Value'].aggregate(['sum', 'mean'])를 사용하여 그룹별로 합계와 평균을 동시에 계산합니다.

grouped.aggregate() 함수를 사용하면 그룹화된 데이터에서 여러 집계 함수를 적용하여 그룹별로 데이터를 요약할 수 있습니다. 이것은 데이터 분석에서 중요한 도구 중 하나입니다.

반응형