반응형
Pandas concat: 데이터 프레임을 합치는 매력적인 방법
파이썬에서 데이터 분석과 처리를 담당하는 Pandas 라이브러리는 많은 기능을 제공합니다. 그 중에서도 pandas.concat 함수는 여러 개의 데이터 프레임을 손쉽게 합치는 데 큰 역할을 합니다. 이 포스팅에서는 pandas.concat 함수의 다양한 사용법과 예제를 소개하여 여러분의 데이터 분석 여정을 더욱 풍요롭게 만들어 보겠습니다!
pandas.concat 함수 소개
pandas.concat 함수는 여러 개의 데이터 프레임이나 시리즈를 특정 축(axis)을 기준으로 연결하는 함수입니다. 이 함수는 데이터 분석 시 다양한 데이터 소스를 결합할 때 유용하게 활용됩니다. 각 데이터 프레임을 수직 또는 수평으로 결합할 수 있습니다.
함수 시그니처
pandas.concat(objs, axis=0, join='outer', ignore_index=False)
매개변수:
- objs: 결합할 데이터 프레임이나 시리즈의 리스트입니다.
- axis: 결합할 축입니다. 기본값은 0이며, 수직 결합을 의미합니다. 1로 설정하면 수평 결합이 됩니다.
- join: 결합 방식입니다. 기본값은 'outer'로, 모든 인덱스의 합집합을 사용합니다. 'inner'를 설정하면 교집합을 사용합니다.
- ignore_index: True로 설정하면 기존 인덱스를 무시하고 새로운 인덱스를 부여합니다.
반환 값:
- 결합된 데이터 프레임입니다.
사용 예제
기본 예제
다음은 두 개의 데이터 프레임을 수직으로 결합하는 기본 예제입니다.
import pandas as pd
# 첫 번째 데이터 프레임 생성
df1 = pd.DataFrame({
'이름': ['철수', '영희'],
'나이': [25, 30]
})
# 두 번째 데이터 프레임 생성
df2 = pd.DataFrame({
'이름': ['미나', '준호'],
'나이': [22, 27]
})
# 데이터 프레임 수직 결합
result = pd.concat([df1, df2])
print(result)
# 출력:
# 이름 나이
# 0 철수 25
# 1 영희 30
# 0 미나 22
# 1 준호 27
수평 결합 예제
이번에는 두 데이터 프레임을 수평으로 결합하는 예제를 보겠습니다.
import pandas as pd
# 첫 번째 데이터 프레임 생성
df1 = pd.DataFrame({
'이름': ['철수', '영희'],
'나이': [25, 30]
})
# 두 번째 데이터 프레임 생성
df2 = pd.DataFrame({
'성별': ['남', '여'],
'국가': ['한국', '한국']
})
# 데이터 프레임 수평 결합
result_horizontal = pd.concat([df1, df2], axis=1)
print(result_horizontal)
# 출력:
# 이름 나이 성별 국가
# 0 철수 25 남 한국
# 1 영희 30 여 한국
인덱스 무시하기
인덱스를 무시하고 새로운 인덱스를 부여하려면 ignore_index=True를 설정할 수 있습니다.
result_with_new_index = pd.concat([df1, df2], ignore_index=True)
print(result_with_new_index)
# 출력:
# 이름 나이
# 0 철수 25
# 1 영희 30
# 2 미나 22
# 3 준호 27
결론
pandas.concat 함수는 데이터 프레임을 효율적으로 합치는 데 매우 유용한 도구입니다. 수직 결합, 수평 결합, 인덱스 조정 등 다양한 기능을 활용하여 여러분의 데이터 분석을 보다 간편하고 효과적으로 만들어 보세요!
- 다양한 데이터 소스를 결합하여 통합된 분석 결과를 도출해 보세요!
- 지금 바로 pandas.concat 함수를 활용하여 멋진 데이터 프레임을 만들어 보세요!
반응형
'Python > Pandas' 카테고리의 다른 글
pandas KeyError: 'index' 오류 해결하기 (0) | 2025.05.08 |
---|---|
pandas.cut으로 구간 분할하기 (0) | 2025.05.08 |
pandas IndexError: cannot mask with array containing NA / NaN values 오류 해결하기 (0) | 2025.05.07 |
pandas IndexError: The indices for the DataFrame are not aligned 오류 해결하기 (0) | 2025.05.07 |
pandas.astype로 데이터형 변환하기 (0) | 2025.05.07 |