Python/Pandas
pandas.merge_join으로 조인 처리하기
PySun
2025. 6. 11. 08:01
반응형
Pandas merge_join: 데이터 프레임을 조인으로 결합하기
파이썬의 Pandas 라이브러리는 데이터 분석과 처리를 위한 강력한 도구입니다. 그 중 merge_join 기능은 서로 다른 데이터 프레임을 조인하여 하나의 통합된 데이터 세트를 만드는 데 사용됩니다. 이 포스팅에서는 pandas.merge_join을 통해 조인 처리하는 방법과 그에 대한 예제를 소개합니다.
Pandas merge_join 소개
merge_join은 두 데이터 프레임을 지정된 열을 기준으로 결합하여 새로운 데이터 프레임을 생성하는 방법입니다. 이는 데이터 간의 관계를 쉽게 표현하고, 새로운 인사이트를 도출하는 데 큰 도움이 됩니다.
함수 시그니처
pandas.DataFrame.merge(right, how='inner', on=None)
매개변수:
- right: 결합할 또 다른 데이터 프레임입니다.
- how: 조인의 종류를 설정합니다. ('inner', 'outer', 'left', 'right')
- on: 조인 키로 사용할 열 이름입니다.
반환 값:
- 조인 처리된 새로운 데이터 프레임을 반환합니다.
사용 예제
기본 예제
다음은 간단한 두 개의 데이터 프레임을 조인하는 예제입니다.
import pandas as pd
# 첫 번째 데이터 프레임 생성
df1 = pd.DataFrame({
'id': [1, 2, 3],
'name': ['Alice', 'Bob', 'Charlie']
})
# 두 번째 데이터 프레임 생성
df2 = pd.DataFrame({
'id': [2, 3, 4],
'age': [25, 30, 35]
})
# 데이터 프레임 조인
result = df1.merge(df2, on='id', how='inner')
print(result)
# 출력:
# id name age
# 0 2 Bob 25
# 1 3 Charlie 30
다양한 조인 예제
조인의 종류에 따라 결과가 달라지는 예제를 살펴보겠습니다.
import pandas as pd
# 첫 번째 데이터 프레임 생성
df1 = pd.DataFrame({
'id': [1, 2, 3],
'name': ['Alice', 'Bob', 'Charlie']
})
# 두 번째 데이터 프레임 생성
df2 = pd.DataFrame({
'id': [2, 3, 4],
'age': [25, 30, 35]
})
# inner 조인
inner_result = df1.merge(df2, on='id', how='inner')
print("Inner Join Result:\n", inner_result)
# outer 조인
outer_result = df1.merge(df2, on='id', how='outer')
print("Outer Join Result:\n", outer_result)
# left 조인
left_result = df1.merge(df2, on='id', how='left')
print("Left Join Result:\n", left_result)
# right 조인
right_result = df1.merge(df2, on='id', how='right')
print("Right Join Result:\n", right_result)
결론
pandas.merge_join은 데이터 분석 시 매우 유용한 도구입니다. 조인을 통해 다양한 데이터 세트를 통합하고, 새로운 인사이트와 정보를 얻을 수 있습니다. 데이터의 관계를 명확히 이해하고 처리할 수 있는 방법을 알고, 분석의 깊이를 더해보세요!
- 데이터 프레임 간의 관계를 명확하게 보려면 merge를 활용해 보세요!
- 현재 데이터 분석에서의 조인 기술로 통합적이고 효과적인 분석을 진행해 보세요!
반응형