Python/Pandas
pandas.join으로 데이터프레임 결합하기
PySun
2025. 6. 10. 08:02
반응형
Pandas join: 데이터프레임 결합의 예술!
파이썬의 데이터 분석 라이브러리인 Pandas는 데이터프레임을 손쉽게 조작할 수 있는 다양한 기능을 제공합니다. 그 중에서도 pandas.join 함수는 두 개의 데이터프레임을 특정 키를 기반으로 결합하는 데 유용합니다. 이번 포스팅에서는 pandas.join의 사용법과 함께 생생한 예제를 통해 그 매력을 탐구해 보겠습니다.
Pandas join 함수 소개
pandas.join 함수는 기본적으로 두 데이터프레임을 인덱스를 기준으로 결합합니다. 이 함수는 데이터의 관계를 시각화하고 분석하는 데 큰 도움을 줍니다. 또한 다양한 조인 방식을 제공하여 필요한 형태의 결합을 쉽게 수행할 수 있습니다.
함수 시그니처
DataFrame.join(other, how='left', on=None, lsuffix='', rsuffix='', sort=False)
매개변수:
- other: 결합할 다른 데이터프레임입니다.
- how: 조인의 유형(‘left’, ‘right’, ‘outer’, ‘inner’ 중 하나)을 지정합니다.
- on: 기준이 될 열의 이름입니다.
- lsuffix: 왼쪽 데이터프레임의 접미사입니다.
- rsuffix: 오른쪽 데이터프레임의 접미사입니다.
- sort: 결합 후 정렬 여부를 결정합니다.
반환 값:
- 결합된 새로운 데이터프레임을 반환합니다.
사용 예제
기본 데이터프레임 결합 예제
아래는 두 개의 데이터프레임을 pandas.join 함수를 사용하여 결합하는 기본 예제입니다.
import pandas as pd
# 첫 번째 데이터프레임 생성
df1 = pd.DataFrame({
'key': ['A', 'B', 'C'],
'value1': [1, 2, 3]
}).set_index('key')
# 두 번째 데이터프레임 생성
df2 = pd.DataFrame({
'key': ['B', 'C', 'D'],
'value2': [4, 5, 6]
}).set_index('key')
# 데이터프레임 결합
result = df1.join(df2, how='inner')
print(result)
# 출력:
# value1 value2
# key
# B 2 4
# C 3 5
다양한 조인 방식 예제
여기서는 다양한 조인 방식을 사용하여 데이터프레임을 결합하는 예제를 보여 드립니다.
import pandas as pd
# 데이터프레임 생성
df1 = pd.DataFrame({
'key': ['A', 'B', 'C'],
'value1': [1, 2, 3]
}).set_index('key')
df2 = pd.DataFrame({
'key': ['B', 'C', 'D'],
'value2': [4, 5, 6]
}).set_index('key')
# left join
left_join = df1.join(df2, how='left')
print("Left Join:\n", left_join)
# right join
right_join = df1.join(df2, how='right')
print("Right Join:\n", right_join)
# outer join
outer_join = df1.join(df2, how='outer')
print("Outer Join:\n", outer_join)
# inner join
inner_join = df1.join(df2, how='inner')
print("Inner Join:\n", inner_join)
결론
pandas.join 함수는 데이터프레임을 유기적으로 결합하는 데 필수적인 도구입니다. 다양한 조인 방식을 통해 당신의 데이터 분석과 시각화를 한층 더 풍부하게 해줍니다.
- 지금 바로 pandas.join 함수를 사용하여 데이터를 새로운 차원으로 확장해 보세요!
- 데이터 결합의 매력을 느끼고, 분석가로서의 역량을 한 단계 끌어올려보세요!
반응형