pandas df.groupby() 함수 활용하기

df.groupby() 함수는 Pandas 데이터프레임에서 그룹화 작업을 수행하는 데 사용됩니다. 이 함수를 사용하면 데이터프레임의 열 값을 기준으로 데이터를 그룹화하고, 그룹화된 데이터에 대해 집계, 변환 또는 다양한 연산을 수행할 수 있습니다.

메서드 구문:

# 함수 구문
grouped = df.groupby(by)

주요 매개변수:

by: 그룹화 기준이 될 열 이름 또는 열 이름의 리스트입니다.

예시 코드:

import pandas as pd

# 샘플 데이터프레임 생성
data = {
    'Category': ['A', 'B', 'A', 'B', 'A', 'C'],
    'Value': [10, 20, 15, 25, 30, 5]
}
df = pd.DataFrame(data)

# 'Category' 열을 기준으로 데이터프레임을 그룹화
grouped = df.groupby('Category')

# 그룹별 합계 계산
grouped_sum = grouped['Value'].sum()

# 그룹별 평균 계산
grouped_mean = grouped['Value'].mean()

위의 코드에서는 샘플 데이터프레임을 생성하고, df.groupby() 함수를 사용하여 'Category' 열을 기준으로 데이터를 그룹화합니다. 그룹화된 데이터를 통해 그룹별 합계와 평균을 계산합니다.

df.groupby() 함수를 사용하면 데이터프레임을 기준 열의 값에 따라 여러 그룹으로 분할할 수 있으며, 그룹별로 데이터를 조작하고 요약할 수 있습니다. 이는 데이터의 세분화 및 집계 작업에 유용합니다.

저작자표시 비영리 변경금지

'Python > Pandas' 카테고리의 다른 글

pandas df.pivot_table() 함수 활용하기 (0)	2023.12.13
pandas grouped.aggregate() 함수 활용하기 (0)	2023.12.12
pandas df.apply() 함수 활용하기 (2)	2023.12.08
pandas df.fillna() 함수 활용하기 (0)	2023.12.07
pandas df.rename() 함수 활용하기 (4)	2023.12.06

pandas df.groupby() 함수 활용하기

메서드 구문:

주요 매개변수:

예시 코드:

'Python > Pandas' 카테고리의 다른 글

관련글

티스토리툴바