Python/Pandas

pandas.join으로 데이터프레임 결합하기

PySun 2025. 6. 10. 08:02
반응형

Pandas join: 데이터프레임 결합의 예술!

파이썬의 데이터 분석 라이브러리인 Pandas는 데이터프레임을 손쉽게 조작할 수 있는 다양한 기능을 제공합니다. 그 중에서도 pandas.join 함수는 두 개의 데이터프레임을 특정 키를 기반으로 결합하는 데 유용합니다. 이번 포스팅에서는 pandas.join의 사용법과 함께 생생한 예제를 통해 그 매력을 탐구해 보겠습니다.

Pandas join 함수 소개

pandas.join 함수는 기본적으로 두 데이터프레임을 인덱스를 기준으로 결합합니다. 이 함수는 데이터의 관계를 시각화하고 분석하는 데 큰 도움을 줍니다. 또한 다양한 조인 방식을 제공하여 필요한 형태의 결합을 쉽게 수행할 수 있습니다.

함수 시그니처

DataFrame.join(other, how='left', on=None, lsuffix='', rsuffix='', sort=False)

매개변수:

  • other: 결합할 다른 데이터프레임입니다.
  • how: 조인의 유형(‘left’, ‘right’, ‘outer’, ‘inner’ 중 하나)을 지정합니다.
  • on: 기준이 될 열의 이름입니다.
  • lsuffix: 왼쪽 데이터프레임의 접미사입니다.
  • rsuffix: 오른쪽 데이터프레임의 접미사입니다.
  • sort: 결합 후 정렬 여부를 결정합니다.

반환 값:

  • 결합된 새로운 데이터프레임을 반환합니다.

사용 예제

기본 데이터프레임 결합 예제

아래는 두 개의 데이터프레임을 pandas.join 함수를 사용하여 결합하는 기본 예제입니다.

import pandas as pd

# 첫 번째 데이터프레임 생성
df1 = pd.DataFrame({
    'key': ['A', 'B', 'C'],
    'value1': [1, 2, 3]
}).set_index('key')

# 두 번째 데이터프레임 생성
df2 = pd.DataFrame({
    'key': ['B', 'C', 'D'],
    'value2': [4, 5, 6]
}).set_index('key')

# 데이터프레임 결합
result = df1.join(df2, how='inner')

print(result)
# 출력:
#      value1  value2
# key                 
# B        2       4
# C        3       5

다양한 조인 방식 예제

여기서는 다양한 조인 방식을 사용하여 데이터프레임을 결합하는 예제를 보여 드립니다.

import pandas as pd

# 데이터프레임 생성
df1 = pd.DataFrame({
    'key': ['A', 'B', 'C'],
    'value1': [1, 2, 3]
}).set_index('key')

df2 = pd.DataFrame({
    'key': ['B', 'C', 'D'],
    'value2': [4, 5, 6]
}).set_index('key')

# left join
left_join = df1.join(df2, how='left')
print("Left Join:\n", left_join)

# right join
right_join = df1.join(df2, how='right')
print("Right Join:\n", right_join)

# outer join
outer_join = df1.join(df2, how='outer')
print("Outer Join:\n", outer_join)

# inner join
inner_join = df1.join(df2, how='inner')
print("Inner Join:\n", inner_join)

결론

pandas.join 함수는 데이터프레임을 유기적으로 결합하는 데 필수적인 도구입니다. 다양한 조인 방식을 통해 당신의 데이터 분석과 시각화를 한층 더 풍부하게 해줍니다.

  • 지금 바로 pandas.join 함수를 사용하여 데이터를 새로운 차원으로 확장해 보세요!
  • 데이터 결합의 매력을 느끼고, 분석가로서의 역량을 한 단계 끌어올려보세요!
반응형