본문 바로가기
Python/Pandas

pandas DataFrame.join으로 데이터 결합하기

by PySun 2025. 5. 4.
반응형

pandas DataFrame.join: 데이터 결합의 미학

데이터 분석의 과정에서 다양한 데이터를 효율적으로 결합하는 것은 필수적입니다. pandas 라이브러리에서 제공하는 DataFrame.join 메서드는 두 개의 DataFrame을 기준 열을 통해 결합할 수 있도록 도와줍니다. 여러분이 데이터를 연결할 때 이 강력한 메서드의 효용성을 느낄 수 있도록 이 글에서 깊이 있게 다뤄보겠습니다.

DataFrame.join 메서드 소개

DataFrame.join 메서드는 두 개의 DataFrame을 서로 결합할 때 사용됩니다. 특정 기준 열을 기준으로 하여, 새로운 데이터 세트를 만들 수 있습니다. 이는 데이터베이스에서의 조인과 유사한 작업이며, 데이터를 통합하는 데 강력한 도구입니다.

메서드 시그니처

DataFrame.join(other, on=None, how='left', lsuffix='', rsuffix='', sort=False)

매개변수:

  • other: 결합할 다른 DataFrame입니다.
  • on: 결합할 기준 열의 이름입니다. None이면 인덱스를 기준으로 합니다.
  • how: 결합 방법을 정의합니다. ('left', 'right', 'outer', 'inner')
  • lsuffix: 왼쪽 DataFrame의 열 이름에 붙일 접미사입니다.
  • rsuffix: 오른쪽 DataFrame의 열 이름에 붙일 접미사입니다.
  • sort: True로 설정하면 결합된 DataFrame을 정렬합니다.

반환 값:

  • 결합된 DataFrame을 반환합니다.

사용 예제

기본 예제

먼저 두 개의 DataFrame을 생성한 후, join 메서드를 사용하여 결합해 보겠습니다.

import pandas as pd

# 첫 번째 DataFrame 생성
df1 = pd.DataFrame({
    'ID': [1, 2, 3],
    '이름': ['Alice', 'Bob', 'Charlie']
}).set_index('ID')

# 두 번째 DataFrame 생성
df2 = pd.DataFrame({
    'ID': [2, 3, 4],
    '나이': [24, 35, 28]
}).set_index('ID')

# DataFrame 결합
result = df1.join(df2, how='inner')

print(result)
# 출력:
#          이름   나이
# ID                 
# 2      Bob   24
# 3  Charlie   35

다양한 결합 방식 예제

이제 다양한 결합 방식을 사용하여 DataFrame을 결합하는 예제를 살펴보겠습니다.

import pandas as pd

# DataFrame 생성
df1 = pd.DataFrame({
    'ID': [1, 2],
    '이름': ['Alice', 'Bob']
}).set_index('ID')

df2 = pd.DataFrame({
    'ID': [2, 3],
    '나이': [24, 35]
}).set_index('ID')

# left join
left_join_result = df1.join(df2, how='left')
print("Left Join 결과:")
print(left_join_result)

# right join
right_join_result = df1.join(df2, how='right')
print("\nRight Join 결과:")
print(right_join_result)

# outer join
outer_join_result = df1.join(df2, how='outer')
print("\nOuter Join 결과:")
print(outer_join_result)

# inner join
inner_join_result = df1.join(df2, how='inner')
print("\nInner Join 결과:")
print(inner_join_result)

결론

DataFrame.join 메서드는 데이터 간의 연결을 한층 더 매끄럽게 만들어줍니다. 여러분이 데이터를 더 효과적으로 조작하고 통합하여, 분석의 깊이를 더할 수 있도록 도와줄 것입니다. 데이터 결합의 힘을 믿고, 이 메서드를 활용하여 아름답게 배열된 데이터 세트를 만들어 보세요!

  • pandas.DataFrame.join을 통해 데이터 통합의 작업을 쉽게 즐겨보세요!
  • 지금 여러분의 데이터로 실험해 보세요! 자신만의 데이터 스토리를 만들어 가는 재미를 느껴보세요!
반응형