본문 바로가기
반응형

Python2011

pandas pd.merge() 함수 활용하기 pd.merge() 함수는 Pandas에서 데이터프레임을 병합 또는 조인하는 데 사용되며, SQL 스타일의 조인 작업을 지원합니다. 이 함수를 사용하면 공통 열을 기반으로 데이터프레임을 병합할 수 있으며, 여러 가지 조인 유형을 지원합니다. 함수 구문: pd.merge( left, right, how='inner', on=None, left_on=None, right_on=None, left_index=False, right_index=False ) 주요 매개변수: left, right: 병합할 데이터프레임. how: 조인 유형을 나타내는 문자열 ('inner', 'outer', 'left', 'right' 등). 기본값은 'inner'. on: 조인할 열(들)의 이름(공통 열의 경우 사용). left_.. 2023. 12. 19.
pandas pd.concat() 함수 활용하기 pd.concat() 함수는 Pandas에서 데이터프레임을 연결 또는 결합하는 데 사용되며, 주어진 축(행 또는 열)을 따라 데이터프레임을 연결할 수 있습니다. 이 함수는 데이터프레임을 수직 또는 수평으로 연결할 때 유용하며, 데이터를 조합하고 결합하는 데 활용됩니다. 함수 구문: pd.concat( objs, axis=0, join='outer', ignore_index=False ) 주요 매개변수: objs: 연결할 데이터프레임(들)을 포함하는 리스트. axis: 연결 방향을 나타내는 축 (0은 수직, 1은 수평) (기본값은 0). join: 열 이름이 다른 경우 어떻게 연결할 것인지 ('outer' 또는 'inner') (기본값은 'outer'). ignore_index: 기존 인덱스를 유지할지 여.. 2023. 12. 18.
pandas pd.plotting.scatter_matrix() 함수 활용하기 pd.plotting.scatter_matrix() 함수는 Pandas에서 산점 행렬(scatter matrix)을 생성하는 데 사용됩니다. 산점 행렬은 데이터프레임의 열 간의 상호 관계를 시각적으로 분석하기 위한 유용한 도구입니다. 이 함수를 사용하면 데이터프레임의 열 간의 모든 가능한 산점도(두 열 간의 관계를 나타내는 그래프)를 하나의 그림에 표시할 수 있습니다. 함수 구문: pd.plotting.scatter_matrix( frame, alpha=0.5, figsize=(6, 6), diagonal='hist', color='b' ) 주요 매개변수: frame: 산점 행렬을 생성할 데이터프레임. alpha: 각 산점도의 투명도 (기본값은 0.5). figsize: 그림의 크기 (기본값은 (6, 6.. 2023. 12. 15.
pandas df.plot() 함수 활용하기 df.plot() 함수는 Pandas 데이터프레임에서 데이터 시각화를 위한 플롯을 생성하는 데 사용됩니다. 이 함수를 사용하면 데이터프레임의 열을 기반으로 그래프를 생성할 수 있으며, Matplotlib를 기반으로 한 시각화를 제공합니다. 메서드 구문: df.plot( x=None, y=None, kind='line', title=None, xlabel=None, ylabel=None, legend=True ) 주요 매개변수: x: x 축에 사용할 열 이름 또는 데이터프레임의 인덱스 열. y: y 축에 사용할 열 이름 또는 데이터프레임의 인덱스 열. kind: 그래프의 종류를 지정하는 문자열 ('line', 'bar', 'barh', 'hist', 'box', 'kde', 'density', 'area'.. 2023. 12. 14.
pandas df.pivot_table() 함수 활용하기 df.pivot_table() 함수는 Pandas에서 데이터프레임을 피벗 테이블로 변환하는 데 사용됩니다. 피벗 테이블은 데이터프레임의 열을 재구성하여 데이터를 요약하고 분석하는 데 유용한 형식으로 변환합니다. 메서드 구문: pd.pivot_table( data, values, index, columns, aggfunc='mean' ) 주요 매개변수: data: 피벗 테이블을 생성할 데이터프레임입니다. values: 피벗 테이블에 나타낼 값 열(들)입니다. index: 피벗 테이블의 행 인덱스로 사용할 열(들)입니다. columns: 피벗 테이블의 열 인덱스로 사용할 열(들)입니다. aggfunc: 집계 함수 (기본값은 'mean'으로 평균)로 데이터를 집계할 방법을 지정합니다. 예시 코드: import.. 2023. 12. 13.
pandas grouped.aggregate() 함수 활용하기 grouped.aggregate() 함수는 Pandas에서 그룹화된 데이터에 대해 집계 함수를 적용하는 데 사용됩니다. 이 함수를 사용하면 그룹화된 데이터에서 다양한 집계 연산을 수행할 수 있습니다. 메서드 구문: # 함수 구문 grouped.aggregate(func) 주요 매개변수: func: 그룹화된 데이터에 적용할 집계 함수입니다. 이 함수는 문자열로 함수 이름을 지정하거나, 직접 사용자 정의 함수를 전달할 수 있습니다. 예시 코드: import pandas as pd # 샘플 데이터프레임 생성 data = { 'Category': ['A', 'B', 'A', 'B', 'A', 'C'], 'Value': [10, 20, 15, 25, 30, 5] } df = pd.DataFrame(data) # .. 2023. 12. 12.
반응형