본문 바로가기
Python/Pandas

pandas df.apply() 함수 활용하기

by PySun 2023. 12. 8.
반응형

df.apply() 함수는 Pandas 데이터프레임의 열 또는 행에 함수를 적용하고 그 결과를 반환하는 데 사용됩니다. 이 함수를 사용하면 사용자 정의 함수를 데이터프레임의 각 열 또는 행에 적용할 수 있습니다.

메서드 구문:

# 함수 구문
df.apply(func, axis=0)

주요 매개변수:

  • func: 적용할 함수, 사용자 정의 함수 또는 내장 함수를 지정합니다.
  • axis: 함수를 적용할 방향을 나타내며, 0은 열 방향, 1은 행 방향입니다.

예시 코드:

import pandas as pd

# 샘플 데이터프레임 생성
data = {
    'A': [1, 2, 3, 4, 5],
    'B': [6, 7, 8, 9, 10],
    'C': [11, 12, 13, 14, 15]
}
df = pd.DataFrame(data)

# 사용자 정의 함수를 적용하여 각 열의 합을 계산
def column_sum(column):
    return column.sum()

column_sums = df.apply(column_sum, axis=0)

# 내장 함수를 적용하여 각 행의 평균을 계산
row_means = df.apply(lambda row: row.mean(), axis=1)

위의 코드에서는 샘플 데이터프레임을 생성하고, df.apply() 함수를 사용하여 각 열의 합과 각 행의 평균을 계산합니다. 사용자 정의 함수나 람다 함수를 func 매개변수로 지정하여 원하는 계산을 수행할 수 있습니다.

df.apply() 함수는 데이터프레임의 각 열 또는 행에 사용자 지정 함수를 적용하여 데이터 조작 및 변환을 수행하는 데 유용합니다.

반응형