반응형
pandas.get_dtype_counts: 데이터 타입 카운트를 손쉽게 세어보세요
데이터 분석에서 각 데이터 타입의 분포를 이해하는 것은 필수적입니다. Pandas 라이브러리의 get_dtype_counts 함수는 DataFrame에서 각 데이터 타입의 개수를 간편하게 알려줍니다. 이번 포스트에서는 get_dtype_counts 함수의 활용법과 코드 예제를 살펴보겠습니다.
get_dtype_counts 함수 소개
get_dtype_counts 함수는 DataFrame 내의 각 데이터 타입을 세어주는 기능을 제공합니다. 이를 통해 어떤 데이터 타입이 많이 포함되어 있는지 쉽게 확인할 수 있으며, 데이터 전처리 과정에서도 유용하게 사용할 수 있습니다.
함수 시그니처
DataFrame.get_dtype_counts()
반환 값:
- 각 데이터 타입별 개수가 포함된 시리즈를 반환합니다.
사용 예제
기본 예제
DataFrame에서 데이터 타입을 카운트하는 기본적인 예제를 살펴보겠습니다.
import pandas as pd
# 예제 데이터를 포함한 DataFrame 생성
data = {
'name': ['Alice', 'Bob', 'Charlie'],
'age': [25, 30, 35],
'salary': [50000.0, 60000.0, 70000.0],
'is_manager': [True, False, True]
}
df = pd.DataFrame(data)
# 데이터 타입 카운트
dtype_counts = df.get_dtype_counts()
print(dtype_counts)
# 출력 예시:
# float64 1
# int64 1
# object 1
# bool 1
# dtype: int64
복잡한 데이터 타입 예제
조금 더 복잡한 예제를 통해 다양한 데이터 타입을 가진 DataFrame의 카운트를 확인해보겠습니다.
import pandas as pd
import numpy as np
# 다양한 데이터를 가진 DataFrame 생성
data_complex = {
'city': ['Seoul', 'Busan', 'Incheon'],
'population': [10000000, 3400000, 2900000],
'coordinates': [np.nan, (35.1796, 129.0756), (37.4563, 126.7052)],
'is_capital': [True, False, False]
}
df_complex = pd.DataFrame(data_complex)
# 데이터 타입 카운트
dtype_counts_complex = df_complex.get_dtype_counts()
print(dtype_counts_complex)
# 출력 예시:
# object 1
# int64 1
# float64 1
# bool 1
# dtype: int64
결론
get_dtype_counts 함수는 데이터 분석 시 각 데이터 타입의 분포를 신속하게 파악할 수 있는 유용한 도구입니다. 이 함수를 활용하면 데이터 전처리 및 분석 과정을 더 효율적으로 수행할 수 있습니다.
- 각 데이터 타입에 대한 이해를 높여 더욱 스마트한 데이터 분석을 시작해보세요!
- 지금 바로 get_dtype_counts 함수를 활용하여 여러분의 데이터 프로세스를 한층 더 개선해보세요!
반응형