본문 바로가기
반응형

Python2011

pandas df.groupby() 함수 활용하기 df.groupby() 함수는 Pandas 데이터프레임에서 그룹화 작업을 수행하는 데 사용됩니다. 이 함수를 사용하면 데이터프레임의 열 값을 기준으로 데이터를 그룹화하고, 그룹화된 데이터에 대해 집계, 변환 또는 다양한 연산을 수행할 수 있습니다. 메서드 구문: # 함수 구문 grouped = df.groupby(by) 주요 매개변수: by: 그룹화 기준이 될 열 이름 또는 열 이름의 리스트입니다. 예시 코드: import pandas as pd # 샘플 데이터프레임 생성 data = { 'Category': ['A', 'B', 'A', 'B', 'A', 'C'], 'Value': [10, 20, 15, 25, 30, 5] } df = pd.DataFrame(data) # 'Category' 열을 기준으.. 2023. 12. 11.
pandas df.apply() 함수 활용하기 df.apply() 함수는 Pandas 데이터프레임의 열 또는 행에 함수를 적용하고 그 결과를 반환하는 데 사용됩니다. 이 함수를 사용하면 사용자 정의 함수를 데이터프레임의 각 열 또는 행에 적용할 수 있습니다. 메서드 구문: # 함수 구문 df.apply(func, axis=0) 주요 매개변수: func: 적용할 함수, 사용자 정의 함수 또는 내장 함수를 지정합니다. axis: 함수를 적용할 방향을 나타내며, 0은 열 방향, 1은 행 방향입니다. 예시 코드: import pandas as pd # 샘플 데이터프레임 생성 data = { 'A': [1, 2, 3, 4, 5], 'B': [6, 7, 8, 9, 10], 'C': [11, 12, 13, 14, 15] } df = pd.DataFrame(dat.. 2023. 12. 8.
pandas df.fillna() 함수 활용하기 df.fillna() 함수는 Pandas 데이터프레임에서 결측치 (NaN 또는 None) 값을 다른 값으로 채우는 데 사용됩니다. 결측치를 대체하거나 채울 값을 지정할 수 있습니다. 메서드 구문: # 함수 구문 df.fillna(value, method, axis, inplace=False) 주요 매개변수: value: 결측치를 대체할 값이나 딕셔너리입니다. method: 결측치를 대체하는 방법으로 'ffill' 또는 'bfill'을 사용할 수 있습니다. 'ffill'은 앞쪽 (이전) 값으로 대체하고 'bfill'은 뒷쪽 (다음) 값으로 대체합니다. axis: 결측치를 대체할 방향으로 0은 열 방향, 1은 행 방향입니다. inplace: True로 설정하면 원본 데이터프레임을 변경하고, False로 설정.. 2023. 12. 7.
pandas df.rename() 함수 활용하기 df.rename() 함수는 Pandas 데이터프레임의 행과 열의 이름을 변경하는 데 사용됩니다. 이 함수를 사용하면 데이터프레임의 열 레이블과 행 인덱스를 수정할 수 있습니다. 메서드 구문: # 함수 구문 df.rename(columns=column_mapping, index=index_mapping, inplace=False) 주요 매개변수: columns: 열 이름을 변경할 때 사용하는 딕셔너리 또는 함수입니다. index: 행 인덱스를 변경할 때 사용하는 딕셔너리 또는 함수입니다. inplace: True로 설정하면 원본 데이터프레임을 변경하고, False로 설정하면 새로운 데이터프레임을 반환합니다. 예시 코드: import pandas as pd # 샘플 데이터프레임 생성 data = { 'Na.. 2023. 12. 6.
pandas df.drop() 함수 활용하기 df.drop() 함수는 Pandas 데이터프레임에서 특정 행 또는 열을 삭제하는 데 사용됩니다. 이 함수를 사용하면 데이터프레임에서 특정 행이나 열을 제거할 수 있습니다. 메서드 구문: # 함수 구문 df.drop(labels, axis=0, inplace=False) 주요 매개변수: labels: 삭제할 행 또는 열을 지정합니다. axis: 삭제할 방향을 나타내며, 0은 행을 삭제하고 1은 열을 삭제합니다. inplace: True로 설정하면 원본 데이터프레임을 변경하고, False로 설정하면 새로운 데이터프레임을 반환합니다. 예시 코드: import pandas as pd # 샘플 데이터프레임 생성 data = { 'Name': ['Alice', 'Bob', 'Charlie', 'David', 'E.. 2023. 12. 5.
pandas df.sort_values() 함수 활용하기 df.sort_values() 함수는 Pandas 데이터프레임에서 열의 값을 기준으로 데이터를 정렬하는 데 사용됩니다. 이 함수를 사용하면 데이터프레임의 행을 특정 열의 값을 기준으로 오름차순 또는 내림차순으로 정렬할 수 있습니다. 메서드 구문: # 함수 구문 df.sort_values(by, ascending=True) 주요 매개변수: by: 정렬 기준이 되는 열의 이름 또는 열의 이름 리스트입니다. ascending: 오름차순으로 정렬할지 여부를 나타내는 부울 값입니다. True로 설정하면 오름차순, False로 설정하면 내림차순으로 정렬됩니다. 예시 코드: import pandas as pd # 샘플 데이터프레임 생성 data = { 'Name': ['Alice', 'Bob', 'Charlie', .. 2023. 12. 4.
반응형