본문 바로가기
Python/Pandas

pandas df.fillna() 함수 활용하기

by PySun 2023. 12. 7.
반응형

df.fillna() 함수는 Pandas 데이터프레임에서 결측치 (NaN 또는 None) 값을 다른 값으로 채우는 데 사용됩니다. 결측치를 대체하거나 채울 값을 지정할 수 있습니다.

메서드 구문:

# 함수 구문
df.fillna(value, method, axis, inplace=False)

주요 매개변수:

  • value: 결측치를 대체할 값이나 딕셔너리입니다.
  • method: 결측치를 대체하는 방법으로 'ffill' 또는 'bfill'을 사용할 수 있습니다. 'ffill'은 앞쪽 (이전) 값으로 대체하고 'bfill'은 뒷쪽 (다음) 값으로 대체합니다.
  • axis: 결측치를 대체할 방향으로 0은 열 방향, 1은 행 방향입니다.
  • inplace: True로 설정하면 원본 데이터프레임을 변경하고, False로 설정하면 새로운 데이터프레임을 반환합니다.

예시 코드:

import pandas as pd
import numpy as np

# 샘플 데이터프레임 생성 (결측치 포함)
data = {
    'Name': ['Alice', 'Bob', 'Charlie', 'David', 'Eve'],
    'Age': [25, None, 35, 28, None],
    'City': ['New York', 'Los Angeles', 'Chicago', None, 'Miami']
}
df = pd.DataFrame(data)

# 결측치를 0으로 대체
df_filled_with_zero = df.fillna(0)

# 결측치를 이전 값으로 대체 (열 방향)
df_filled_ffill = df.fillna(method='ffill', axis=0)

# 결측치를 다음 값으로 대체 (행 방향)
df_filled_bfill = df.fillna(method='bfill', axis=1)

위의 코드에서는 샘플 데이터프레임을 생성하고, df.fillna() 함수를 사용하여 결측치를 대체하는 여러 가지 방법을 보여줍니다. 결측치를 특정 값 (예: 0)으로 대체하거나, 이전 값 또는 다음 값으로 대체하는 방법을 사용할 수 있습니다.

df.fillna() 함수를 사용하면 데이터프레임의 결측치를 처리하고 데이터의 빈 부분을 대체하여 분석 및 시각화 작업을 수월하게 수행할 수 있습니다.

반응형