본문 바로가기
Python/Pandas

pandas pd.concat() 함수 활용하기

by PySun 2023. 12. 18.
반응형

pd.concat() 함수는 Pandas에서 데이터프레임을 연결 또는 결합하는 데 사용되며, 주어진 축(행 또는 열)을 따라 데이터프레임을 연결할 수 있습니다. 이 함수는 데이터프레임을 수직 또는 수평으로 연결할 때 유용하며, 데이터를 조합하고 결합하는 데 활용됩니다.

함수 구문:

pd.concat(
    objs,
    axis=0,
    join='outer',
    ignore_index=False
)

주요 매개변수:

  • objs: 연결할 데이터프레임(들)을 포함하는 리스트.
  • axis: 연결 방향을 나타내는 축 (0은 수직, 1은 수평) (기본값은 0).
  • join: 열 이름이 다른 경우 어떻게 연결할 것인지 ('outer' 또는 'inner') (기본값은 'outer').
  • ignore_index: 기존 인덱스를 유지할지 여부를 나타내는 불리언 값 (기본값은 False).

예시 코드:

import pandas as pd

# 샘플 데이터프레임 생성
data1 = {'A': [1, 2, 3], 'B': [4, 5, 6]}
data2 = {'A': [7, 8, 9], 'B': [10, 11, 12]}
df1 = pd.DataFrame(data1)
df2 = pd.DataFrame(data2)

# 수직 방향으로 데이터프레임 연결
result_vertical = pd.concat([df1, df2], axis=0)

# 수평 방향으로 데이터프레임 연결
result_horizontal = pd.concat([df1, df2], axis=1)

위의 코드에서는 두 개의 샘플 데이터프레임을 생성하고, pd.concat() 함수를 사용하여 이러한 데이터프레임을 수직 및 수평 방향으로 연결합니다. 수직 방향 연결은 인덱스가 유지되며, 수평 방향 연결은 열이 추가됩니다. 이를 통해 데이터를 연결하거나 결합할 수 있습니다.

반응형