반응형
df.fillna() 함수는 Pandas 데이터프레임에서 결측치 (NaN 또는 None) 값을 다른 값으로 채우는 데 사용됩니다. 결측치를 대체하거나 채울 값을 지정할 수 있습니다.
메서드 구문:
# 함수 구문
df.fillna(value, method, axis, inplace=False)
주요 매개변수:
- value: 결측치를 대체할 값이나 딕셔너리입니다.
- method: 결측치를 대체하는 방법으로 'ffill' 또는 'bfill'을 사용할 수 있습니다. 'ffill'은 앞쪽 (이전) 값으로 대체하고 'bfill'은 뒷쪽 (다음) 값으로 대체합니다.
- axis: 결측치를 대체할 방향으로 0은 열 방향, 1은 행 방향입니다.
- inplace: True로 설정하면 원본 데이터프레임을 변경하고, False로 설정하면 새로운 데이터프레임을 반환합니다.
예시 코드:
import pandas as pd
import numpy as np
# 샘플 데이터프레임 생성 (결측치 포함)
data = {
'Name': ['Alice', 'Bob', 'Charlie', 'David', 'Eve'],
'Age': [25, None, 35, 28, None],
'City': ['New York', 'Los Angeles', 'Chicago', None, 'Miami']
}
df = pd.DataFrame(data)
# 결측치를 0으로 대체
df_filled_with_zero = df.fillna(0)
# 결측치를 이전 값으로 대체 (열 방향)
df_filled_ffill = df.fillna(method='ffill', axis=0)
# 결측치를 다음 값으로 대체 (행 방향)
df_filled_bfill = df.fillna(method='bfill', axis=1)
위의 코드에서는 샘플 데이터프레임을 생성하고, df.fillna() 함수를 사용하여 결측치를 대체하는 여러 가지 방법을 보여줍니다. 결측치를 특정 값 (예: 0)으로 대체하거나, 이전 값 또는 다음 값으로 대체하는 방법을 사용할 수 있습니다.
df.fillna() 함수를 사용하면 데이터프레임의 결측치를 처리하고 데이터의 빈 부분을 대체하여 분석 및 시각화 작업을 수월하게 수행할 수 있습니다.
반응형
'Python > Pandas' 카테고리의 다른 글
pandas df.groupby() 함수 활용하기 (2) | 2023.12.11 |
---|---|
pandas df.apply() 함수 활용하기 (2) | 2023.12.08 |
pandas df.rename() 함수 활용하기 (4) | 2023.12.06 |
pandas df.drop() 함수 활용하기 (0) | 2023.12.05 |
pandas df.sort_values() 함수 활용하기 (0) | 2023.12.04 |