본문 바로가기
Python/Pandas

pandas pd.merge() 함수 활용하기

by PySun 2023. 12. 19.
반응형

pd.merge() 함수는 Pandas에서 데이터프레임을 병합 또는 조인하는 데 사용되며, SQL 스타일의 조인 작업을 지원합니다. 이 함수를 사용하면 공통 열을 기반으로 데이터프레임을 병합할 수 있으며, 여러 가지 조인 유형을 지원합니다.

함수 구문:

pd.merge(
    left,
    right,
    how='inner',
    on=None,
    left_on=None,
    right_on=None,
    left_index=False,
    right_index=False
)

주요 매개변수:

  • left, right: 병합할 데이터프레임.
  • how: 조인 유형을 나타내는 문자열 ('inner', 'outer', 'left', 'right' 등). 기본값은 'inner'.
  • on: 조인할 열(들)의 이름(공통 열의 경우 사용).
  • left_on, right_on: 왼쪽 및 오른쪽 데이터프레임에서 조인할 열의 이름(공통 열이 아닌 경우 사용).
  • left_index, right_index: 인덱스를 기반으로 조인할지 여부를 나타내는 불리언 값.

예시 코드:

import pandas as pd

# 샘플 데이터프레임 생성
data1 = {'key': ['A', 'B', 'C', 'D'],
         'value1': [1, 2, 3, 4]}
data2 = {'key': ['B', 'D', 'E', 'F'],
         'value2': [5, 6, 7, 8]}

df1 = pd.DataFrame(data1)
df2 = pd.DataFrame(data2)

# 'key' 열을 기준으로 데이터프레임 병합
result_inner = pd.merge(df1, df2, on='key', how='inner')  # 내부 조인

result_outer = pd.merge(df1, df2, on='key', how='outer')  # 외부 조인

result_left = pd.merge(df1, df2, on='key', how='left')    # 왼쪽 조인

result_right = pd.merge(df1, df2, on='key', how='right')  # 오른쪽 조인

위의 코드에서는 두 개의 샘플 데이터프레임을 생성하고, pd.merge() 함수를 사용하여 'key' 열을 기준으로 데이터프레임을 병합합니다. 내부 조인, 외부 조인, 왼쪽 조인 및 오른쪽 조인을 수행한 결과가 각각 출력됩니다. 이를 통해 다양한 조인 유형을 이해하고 활용할 수 있습니다.

 

반응형