본문 바로가기
Python/Pandas

pandas.notnull로 비결측값 확인하기

by PySun 2025. 5. 15.
반응형

Pandas notnull 함수: 데이터프레임에서 비결측값 확인하기

파이썬의 Pandas 라이브러리는 데이터 분석에 있어 필수적인 도구입니다. 그중 pandas.notnull 함수는 데이터프레임이나 시리즈에서 결측값이 아닌 값들을 확인하는 데 유용한 방법입니다. 이번 포스팅에서는 pandas.notnull 함수의 사용법과 실제 예제를 통해 비결측값을 확인하는 방법을 살펴보겠습니다.

notnull 함수 소개

pandas.notnull 함수는 주어진 데이터에서 결측값이 아닌(non-null) 값을 확인하는 데 사용됩니다. 이 함수는 데이터 클린징 및 분석 과정에서 중요한 역할을 하며, 어떤 값이 유효한지를 쉽게 식별할 수 있도록 돕습니다.

함수 시그니처

pandas.notnull(obj)

매개변수:

  • obj: 비결측값을 확인할 Pandas 데이터 구조(시리즈 또는 데이터프레임)입니다.

반환 값:

  • 입력된 데이터 구조와 동일한 형태의 불리언 배열을 반환하며, 결측값이 아닌 경우에는 True, 결측값인 경우에는 False를 나타냅니다.

사용 예제

기본 예제

아래는 pandas.notnull 함수를 사용해 데이터프레임에서 비결측값을 확인하는 기본 예제입니다.

import pandas as pd
import numpy as np

# 데이터프레임 생성
data = {
    'A': [1, 2, np.nan, 4],
    'B': ['apple', np.nan, 'banana', 'cherry'],
}

df = pd.DataFrame(data)

# 비결측값 확인
is_notnull = pd.notnull(df)

print(is_notnull)
# 출력:
#        A      B
# 0   True   True
# 1   True  False
# 2  False   True
# 3   True   True

시리즈에서 비결측값 확인

시리즈에서도 pandas.notnull 함수를 활용하여 비결측값을 쉽게 확인할 수 있습니다.

import pandas as pd
import numpy as np

# 시리즈 생성
s = pd.Series([1, 2, np.nan, 4, np.nan])

# 비결측값 확인
is_notnull_series = pd.notnull(s)

print(is_notnull_series)
# 출력:
# 0     True
# 1     True
# 2    False
# 3     True
# 4    False
# dtype: bool

결론

pandas.notnull 함수는 데이터프레임이나 시리즈에서 비결측값을 확인하는 데 매우 유용합니다. 이를 통해 데이터 전처리와 분석에서 보다 정제로된 정보를 확보할 수 있으며, 결측값 처리 과정에서 유연하게 대처할 수 있습니다.

  • notnull 함수를 사용하여 여러분의 데이터가 얼마나 깨끗한지 확인해보세요!
  • 지금 바로 pandas.notnull 함수를 활용하여 비결측값을 손쉽게 체크해보세요!
반응형