Python/Pandas
pandas.value_counts로 값의 개수 세기
PySun
2025. 5. 25. 08:02
반응형
Pandas value_counts: 데이터의 가치를 세어보자!
파이썬의 Pandas 라이브러리는 데이터 분석에 있어 귀중한 도구이며, 그중 value_counts 함수는 특정 열의 고유값과 해당 값의 개수를 손쉽게 파악할 수 있게 해줍니다. 이번 포스팅에서는 pandas.value_counts 함수의 사용법과 함께 직접 사용할 수 있는 예제를 소개합니다.
pandas.value_counts 함수 소개
value_counts 메서드는 데이터프레임의 특정 열에서 고유값들을 세어 배치해주는 함수입니다. 이 함수를 통해 우리는 데이터의 분포를 빠르게 이해할 수 있으며, 각 값의 빈도를 시각적으로 확인할 수 있는 기회를 가집니다.
함수 시그니처
Series.value_counts(normalize=False, sort=True, ascending=False, bins=None, dropna=True)
매개변수:
- normalize: True로 설정하면 비율로 반환합니다.
- sort: True로 설정하면 고유값을 빈도 기준으로 정렬합니다.
- ascending: True로 설정하면 오름차순으로 정렬합니다.
- bins: 숫자형 데이터를 구간으로 나누어 카운트합니다.
- dropna: True로 설정하면 결측값을 제외합니다.
반환 값:
- 고유값과 해당 값의 개수가 담긴 시리즈 객체를 반환합니다.
사용 예제
기본 예제
아래는 value_counts 함수를 사용하여 열에 있는 값의 개수를 세는 간단한 예제입니다.
import pandas as pd
# 데이터프레임 생성
data = {'이름': ['Alice', 'Bob', 'Alice', 'Charlie', 'Bob', 'Alice']}
df = pd.DataFrame(data)
# 각 이름의 개수 세기
name_counts = df['이름'].value_counts()
print(name_counts)
# 출력:
# Alice 3
# Bob 2
# Charlie 1
# Name: 이름, dtype: int64
비율로 확인하기
비율로도 고유값의 개수를 확인할 수 있습니다.
import pandas as pd
# 데이터프레임 생성
data = {'과일': ['사과', '바나나', '사과', '오렌지', '바나나', '사과']}
df = pd.DataFrame(data)
# 각 과일의 비율 세기
fruit_counts = df['과일'].value_counts(normalize=True)
print(fruit_counts)
# 출력:
# 사과 0.5
# 바나나 0.333333
# 오렌지 0.166667
# Name: 과일, dtype: float64
결론
pandas.value_counts 함수는 데이터의 고유값과 그 빈도를 세어보는 데 있어 최고의 도구입니다. 이를 통해 우리는 데이터를 더 잘 이해하고, 인사이트를 얻을 수 있습니다. 데이터 분석의 첫걸음은 고유값의 개수를 확인하는 것에서 시작됩니다!
- 지금 바로 value_counts 함수를 활용하여 데이터의 고유한 이야기를 들어보세요!
- 데이터 내의 패턴과 트렌드를 발견하고, 데이터 분석의 세계에 뛰어들어 보세요!
반응형