본문 바로가기
Python/Pandas

pandas.merge로 데이터 프레임 조인하기

by PySun 2025. 5. 15.
반응형

Pandas merge: 데이터 프레임을 조인하여 관계형 데이터 처리하기

파이썬의 Pandas 라이브러리는 데이터 분석과 조작을 위한 핵심 도구입니다. 그 중에서도 pandas.merge 함수는 두 개 이상의 데이터 프레임을 특정 키를 기반으로 결합하는 데 사용됩니다. 이 포스팅에서는 pandas.merge 함수의 사용법과 실제 코드 예제를 통해 데이터 조인 기술을 탐구해 보겠습니다.

pandas.merge 함수 소개

pandas.merge 함수는 데이터 프레임 간의 조인을 수행하는 강력한 도구입니다. 이 함수는 데이터의 관계를 이해하고, 다양한 방식으로 데이터를 결합할 수 있게 해 주며, SQL과 유사한 방식으로 작업할 수 있게 합니다.

함수 시그니처

pandas.merge(left, right, how='inner', on=None)

매개변수:

  • left: 조인할 첫 번째 데이터 프레임입니다.
  • right: 조인할 두 번째 데이터 프레임입니다.
  • how: 'inner', 'outer', 'left', 'right' 중 하나로, 조인의 방법을 선택합니다. 기본값은 'inner'입니다.
  • on: 조인할 키 열을 지정합니다.

반환 값:

  • 조인된 결과 데이터 프레임을 반환합니다.

사용 예제

기본 예제

다음은 pandas.merge 함수를 사용하여 두 개의 데이터 프레임을 간단하게 결합하는 예제입니다.

import pandas as pd

# 첫 번째 데이터 프레임 생성
data1 = {'ID': [1, 2, 3], '이름': ['홍길동', '임꺽정', '유관순']}
df1 = pd.DataFrame(data1)

# 두 번째 데이터 프레임 생성
data2 = {'ID': [1, 2, 4], '나이': [25, 30, 22]}
df2 = pd.DataFrame(data2)

# 데이터 프레임 조인
result = pd.merge(df1, df2, on='ID', how='inner')

print(result)
# 출력:
#    ID   이름  나이
# 0  1  홍길동   25
# 1  2  임꺽정   30

다양한 조인 방법 예제

조인 방법에 따라 결과가 어떻게 달라지는지 알아보겠습니다.

import pandas as pd

# 첫 번째 데이터 프레임 생성
data1 = {'ID': [1, 2, 3], '이름': ['홍길동', '임꺽정', '유관순']}
df1 = pd.DataFrame(data1)

# 두 번째 데이터 프레임 생성
data2 = {'ID': [1, 2, 4], '나이': [25, 30, 22]}
df2 = pd.DataFrame(data2)

# Inner Join
inner_result = pd.merge(df1, df2, on='ID', how='inner')

# Outer Join
outer_result = pd.merge(df1, df2, on='ID', how='outer')

print("Inner Join 결과:")
print(inner_result)
print("\nOuter Join 결과:")
print(outer_result)
# 출력:
# Inner Join 결과:
#    ID   이름  나이
# 0  1  홍길동   25
# 1  2  임꺽정   30
#
# Outer Join 결과:
#    ID   이름   나이
# 0  1  홍길동  25.0
# 1  2  임꺽정  30.0
# 2  3  유관순   NaN
# 3  4   NaN  22.0

결론

pandas.merge 함수를 통해 데이터 프레임 간의 조인을 쉽게 수행할 수 있습니다. 이를 활용하면 데이터 분석의 범위를 넓히고, 다양한 데이터를 조합하여 유용한 인사이트를 도출할 수 있습니다.

  • 간단하고 직관적인 방법으로 데이터 프레임을 결합하여 보다 심층적인 분석을 시도해 보세요!
  • 지금 바로 pandas.merge 함수를 활용하여 데이터의 관계를 탐색해 보세요!
반응형