본문 바로가기
Python/Pandas

pandas df.pivot_table() 함수 활용하기

by PySun 2023. 12. 13.
반응형

df.pivot_table() 함수는 Pandas에서 데이터프레임을 피벗 테이블로 변환하는 데 사용됩니다. 피벗 테이블은 데이터프레임의 열을 재구성하여 데이터를 요약하고 분석하는 데 유용한 형식으로 변환합니다.

메서드 구문:

pd.pivot_table(
    data,
    values,
    index,
    columns,
    aggfunc='mean'
)

주요 매개변수:

  • data: 피벗 테이블을 생성할 데이터프레임입니다.
  • values: 피벗 테이블에 나타낼 값 열(들)입니다.
  • index: 피벗 테이블의 행 인덱스로 사용할 열(들)입니다.
  • columns: 피벗 테이블의 열 인덱스로 사용할 열(들)입니다.
  • aggfunc: 집계 함수 (기본값은 'mean'으로 평균)로 데이터를 집계할 방법을 지정합니다.

예시 코드:

import pandas as pd

# 샘플 데이터프레임 생성
data = {
    'Category': ['A', 'B', 'A', 'B', 'A', 'C'],
    'Value1': [10, 20, 15, 25, 30, 5],
    'Value2': [100, 200, 150, 250, 300, 50]
}
df = pd.DataFrame(data)

# 피벗 테이블 생성
pivot_table = pd.pivot_table(df, values=['Value1', 'Value2'], index='Category', aggfunc='mean')

위의 코드에서는 샘플 데이터프레임을 생성하고, pd.pivot_table() 함수를 사용하여 'Category' 열을 행 인덱스로, 'Value1' 및 'Value2' 열을 값으로 사용하여 피벗 테이블을 생성합니다. 피벗 테이블은 그룹화된 데이터를 집계하고 요약하는 데 유용한 형식으로 데이터를 변환합니다.

피벗 테이블은 데이터 분석에서 데이터 요약 및 시각화 작업에 자주 사용됩니다.

반응형