본문 바로가기
반응형

Python/Pandas76

pandas df.pivot_table() 함수 활용하기 df.pivot_table() 함수는 Pandas에서 데이터프레임을 피벗 테이블로 변환하는 데 사용됩니다. 피벗 테이블은 데이터프레임의 열을 재구성하여 데이터를 요약하고 분석하는 데 유용한 형식으로 변환합니다. 메서드 구문: pd.pivot_table( data, values, index, columns, aggfunc='mean' ) 주요 매개변수: data: 피벗 테이블을 생성할 데이터프레임입니다. values: 피벗 테이블에 나타낼 값 열(들)입니다. index: 피벗 테이블의 행 인덱스로 사용할 열(들)입니다. columns: 피벗 테이블의 열 인덱스로 사용할 열(들)입니다. aggfunc: 집계 함수 (기본값은 'mean'으로 평균)로 데이터를 집계할 방법을 지정합니다. 예시 코드: import.. 2023. 12. 13.
pandas grouped.aggregate() 함수 활용하기 grouped.aggregate() 함수는 Pandas에서 그룹화된 데이터에 대해 집계 함수를 적용하는 데 사용됩니다. 이 함수를 사용하면 그룹화된 데이터에서 다양한 집계 연산을 수행할 수 있습니다. 메서드 구문: # 함수 구문 grouped.aggregate(func) 주요 매개변수: func: 그룹화된 데이터에 적용할 집계 함수입니다. 이 함수는 문자열로 함수 이름을 지정하거나, 직접 사용자 정의 함수를 전달할 수 있습니다. 예시 코드: import pandas as pd # 샘플 데이터프레임 생성 data = { 'Category': ['A', 'B', 'A', 'B', 'A', 'C'], 'Value': [10, 20, 15, 25, 30, 5] } df = pd.DataFrame(data) # .. 2023. 12. 12.
pandas df.groupby() 함수 활용하기 df.groupby() 함수는 Pandas 데이터프레임에서 그룹화 작업을 수행하는 데 사용됩니다. 이 함수를 사용하면 데이터프레임의 열 값을 기준으로 데이터를 그룹화하고, 그룹화된 데이터에 대해 집계, 변환 또는 다양한 연산을 수행할 수 있습니다. 메서드 구문: # 함수 구문 grouped = df.groupby(by) 주요 매개변수: by: 그룹화 기준이 될 열 이름 또는 열 이름의 리스트입니다. 예시 코드: import pandas as pd # 샘플 데이터프레임 생성 data = { 'Category': ['A', 'B', 'A', 'B', 'A', 'C'], 'Value': [10, 20, 15, 25, 30, 5] } df = pd.DataFrame(data) # 'Category' 열을 기준으.. 2023. 12. 11.
pandas df.apply() 함수 활용하기 df.apply() 함수는 Pandas 데이터프레임의 열 또는 행에 함수를 적용하고 그 결과를 반환하는 데 사용됩니다. 이 함수를 사용하면 사용자 정의 함수를 데이터프레임의 각 열 또는 행에 적용할 수 있습니다. 메서드 구문: # 함수 구문 df.apply(func, axis=0) 주요 매개변수: func: 적용할 함수, 사용자 정의 함수 또는 내장 함수를 지정합니다. axis: 함수를 적용할 방향을 나타내며, 0은 열 방향, 1은 행 방향입니다. 예시 코드: import pandas as pd # 샘플 데이터프레임 생성 data = { 'A': [1, 2, 3, 4, 5], 'B': [6, 7, 8, 9, 10], 'C': [11, 12, 13, 14, 15] } df = pd.DataFrame(dat.. 2023. 12. 8.
pandas df.fillna() 함수 활용하기 df.fillna() 함수는 Pandas 데이터프레임에서 결측치 (NaN 또는 None) 값을 다른 값으로 채우는 데 사용됩니다. 결측치를 대체하거나 채울 값을 지정할 수 있습니다. 메서드 구문: # 함수 구문 df.fillna(value, method, axis, inplace=False) 주요 매개변수: value: 결측치를 대체할 값이나 딕셔너리입니다. method: 결측치를 대체하는 방법으로 'ffill' 또는 'bfill'을 사용할 수 있습니다. 'ffill'은 앞쪽 (이전) 값으로 대체하고 'bfill'은 뒷쪽 (다음) 값으로 대체합니다. axis: 결측치를 대체할 방향으로 0은 열 방향, 1은 행 방향입니다. inplace: True로 설정하면 원본 데이터프레임을 변경하고, False로 설정.. 2023. 12. 7.
pandas df.rename() 함수 활용하기 df.rename() 함수는 Pandas 데이터프레임의 행과 열의 이름을 변경하는 데 사용됩니다. 이 함수를 사용하면 데이터프레임의 열 레이블과 행 인덱스를 수정할 수 있습니다. 메서드 구문: # 함수 구문 df.rename(columns=column_mapping, index=index_mapping, inplace=False) 주요 매개변수: columns: 열 이름을 변경할 때 사용하는 딕셔너리 또는 함수입니다. index: 행 인덱스를 변경할 때 사용하는 딕셔너리 또는 함수입니다. inplace: True로 설정하면 원본 데이터프레임을 변경하고, False로 설정하면 새로운 데이터프레임을 반환합니다. 예시 코드: import pandas as pd # 샘플 데이터프레임 생성 data = { 'Na.. 2023. 12. 6.
반응형