Python/Pandas

pandas.merge_join으로 조인 처리하기

PySun 2025. 6. 11. 08:01
반응형

Pandas merge_join: 데이터 프레임을 조인으로 결합하기

파이썬의 Pandas 라이브러리는 데이터 분석과 처리를 위한 강력한 도구입니다. 그 중 merge_join 기능은 서로 다른 데이터 프레임을 조인하여 하나의 통합된 데이터 세트를 만드는 데 사용됩니다. 이 포스팅에서는 pandas.merge_join을 통해 조인 처리하는 방법과 그에 대한 예제를 소개합니다.

Pandas merge_join 소개

merge_join은 두 데이터 프레임을 지정된 열을 기준으로 결합하여 새로운 데이터 프레임을 생성하는 방법입니다. 이는 데이터 간의 관계를 쉽게 표현하고, 새로운 인사이트를 도출하는 데 큰 도움이 됩니다.

함수 시그니처

pandas.DataFrame.merge(right, how='inner', on=None)

매개변수:

  • right: 결합할 또 다른 데이터 프레임입니다.
  • how: 조인의 종류를 설정합니다. ('inner', 'outer', 'left', 'right')
  • on: 조인 키로 사용할 열 이름입니다.

반환 값:

  • 조인 처리된 새로운 데이터 프레임을 반환합니다.

사용 예제

기본 예제

다음은 간단한 두 개의 데이터 프레임을 조인하는 예제입니다.

import pandas as pd

# 첫 번째 데이터 프레임 생성
df1 = pd.DataFrame({
    'id': [1, 2, 3],
    'name': ['Alice', 'Bob', 'Charlie']
})

# 두 번째 데이터 프레임 생성
df2 = pd.DataFrame({
    'id': [2, 3, 4],
    'age': [25, 30, 35]
})

# 데이터 프레임 조인
result = df1.merge(df2, on='id', how='inner')

print(result)
# 출력:
#    id     name  age
# 0  2      Bob   25
# 1  3  Charlie   30

다양한 조인 예제

조인의 종류에 따라 결과가 달라지는 예제를 살펴보겠습니다.

import pandas as pd

# 첫 번째 데이터 프레임 생성
df1 = pd.DataFrame({
    'id': [1, 2, 3],
    'name': ['Alice', 'Bob', 'Charlie']
})

# 두 번째 데이터 프레임 생성
df2 = pd.DataFrame({
    'id': [2, 3, 4],
    'age': [25, 30, 35]
})

# inner 조인
inner_result = df1.merge(df2, on='id', how='inner')
print("Inner Join Result:\n", inner_result)

# outer 조인
outer_result = df1.merge(df2, on='id', how='outer')
print("Outer Join Result:\n", outer_result)

# left 조인
left_result = df1.merge(df2, on='id', how='left')
print("Left Join Result:\n", left_result)

# right 조인
right_result = df1.merge(df2, on='id', how='right')
print("Right Join Result:\n", right_result)

결론

pandas.merge_join은 데이터 분석 시 매우 유용한 도구입니다. 조인을 통해 다양한 데이터 세트를 통합하고, 새로운 인사이트와 정보를 얻을 수 있습니다. 데이터의 관계를 명확히 이해하고 처리할 수 있는 방법을 알고, 분석의 깊이를 더해보세요!

  • 데이터 프레임 간의 관계를 명확하게 보려면 merge를 활용해 보세요!
  • 현재 데이터 분석에서의 조인 기술로 통합적이고 효과적인 분석을 진행해 보세요!
반응형