Python/Pandas
pandas.pivot으로 데이터 변형하기
PySun
2025. 5. 17. 08:01
반응형
Pandas pivot: 데이터 변형의 마법
데이터 분석의 세계에서, 데이터를 잘 다루는 것은 성공의 열쇠입니다. Pandas 라이브러리의 pivot 함수는 데이터프레임을 손쉽게 변형할 수 있는 강력한 도구입니다. 이번 포스팅에서는 pivot 함수를 사용하여 데이터를 어떻게 변형할 수 있는지를 살펴보겠습니다.
pandas.pivot 함수 소개
pivot 함수는 기존의 데이터프레임을 바탕으로 데이터를 재구성하여 더 유용한 형태로 만드는 데 사용됩니다. 마치 퍼즐 조각을 맞춰 새로운 그림을 만드는 것처럼 기존의 데이터를 변형시켜 새로운 통찰력을 얻을 수 있습니다.
함수 시그니처
DataFrame.pivot(index=None, columns=None, values=None)
매개변수:
- index: 새로운 데이터프레임의 인덱스가 될 열의 이름입니다.
- columns: 새로운 데이터프레임의 열로 변환할 열의 이름입니다.
- values: 새로운 데이터프레임에서 사용할 값의 열의 이름입니다.
반환 값:
- 인덱스와 열이 재구성된 새로운 데이터프레임을 반환합니다.
사용 예제
기본 예제
다음은 pandas.pivot 함수를 사용하여 간단한 데이터프레임을 변형하는 예제입니다.
import pandas as pd
# 데이터프레임 생성
data = {
'Date': ['2024-01-01', '2024-01-01', '2024-01-02', '2024-01-02'],
'City': ['Seoul', 'Busan', 'Seoul', 'Busan'],
'Temperature': [5, 10, 6, 11]
}
df = pd.DataFrame(data)
# 데이터프레임을 pivot 변형
pivot_df = df.pivot(index='Date', columns='City', values='Temperature')
print(pivot_df)
# 출력:
# City Busan Seoul
# Date
# 2024-01-01 10 5
# 2024-01-02 11 6
다양한 데이터 변형 예제
위의 예제와 같이 다양한 열을 가진 데이터프레임을 사용하여 재구성할 수 있습니다.
import pandas as pd
# 더 복잡한 데이터프레임 생성
data = {
'Product': ['A', 'A', 'B', 'B', 'C', 'C'],
'Quarter': ['Q1', 'Q2', 'Q1', 'Q2', 'Q1', 'Q2'],
'Sales': [150, 200, 300, 350, 100, 120]
}
df = pd.DataFrame(data)
# 데이터프레임을 pivot 변형
pivot_df = df.pivot(index='Product', columns='Quarter', values='Sales')
print(pivot_df)
# 출력:
# Quarter Q1 Q2
# Product
# A 150 200
# B 300 350
# C 100 120
결론
pandas.pivot 함수는 데이터 분석 과정에서 데이터를 직관적으로 변형하고 재구성하는 데 매우 유용합니다. 이를 통해 우리는 더 나은 통찰력을 얻고 데이터의 숨겨진 패턴을 발견할 수 있습니다.
- pivot 함수를 활용하여 복잡한 데이터를 손쉽게 변형해 보세요!
- 지금 바로 pandas.pivot을 사용하여 데이터를 재구성하고, 여러분의 데이터 분석을 다음 단계로 발전시켜 보세요!
반응형