반응형 Python2009 pandas dataframe 그룹화 개념과 활용 판다스 라이브러리를 사용하여 데이터를 그룹화하고 그룹화된 데이터를 활용하는 다양한 케이스에 대한 예시 코드와 함께 설명하겠습니다. Case 1: 단일 열을 기준으로 그룹화하기 데이터를 단일 열을 기준으로 그룹화하고 각 그룹에 대한 통계를 계산하는 경우입니다. import pandas as pd # 샘플 데이터프레임 생성 data = {'과목': ['수학', '과학', '수학', '과학', '영어'], '점수': [90, 85, 88, 92, 78]} df = pd.DataFrame(data) # '과목' 열을 기준으로 그룹화하여 평균 점수 계산 grouped = df.groupby('과목')['점수'].mean() # 결과 확인 print(grouped) Case 2: 여러 열을 기준으로 그룹화하기 여러.. 2023. 9. 21. pandas dataframe 결측치 처리 판다스 라이브러리를 사용하여 결측치(NaN)를 처리하는 다양한 케이스에 대한 예시 코드와 함께 설명하겠습니다. Case 1: 결측치 확인 데이터프레임에서 결측치를 확인하고 싶은 경우입니다. import pandas as pd import numpy as np # 샘플 데이터프레임 생성 (결측치 포함) data = {'A': [1, 2, np.nan, 4], 'B': [5, np.nan, 7, 8]} df = pd.DataFrame(data) # 결측치 확인 missing_values = df.isnull() # 결과 확인 print(missing_values) Case 2: 결측치 제거 데이터프레임에서 결측치를 제거하려는 경우입니다. import pandas as pd import numpy as np .. 2023. 9. 20. pandas dataframe 데이터 정렬과 변환 판다스 라이브러리를 사용하여 데이터를 정렬하고 변환하는 다양한 케이스에 대한 예시 코드와 함께 설명하겠습니다. Case 1: 데이터프레임 정렬하기 데이터프레임을 특정 열(컬럼)을 기준으로 오름차순 또는 내림차순으로 정렬하는 경우입니다. import pandas as pd # 샘플 데이터프레임 생성 data = {'이름': ['Alice', 'Bob', 'Charlie'], '나이': [30, 25, 35]} df = pd.DataFrame(data) # '나이' 열을 기준으로 오름차순 정렬 sorted_df = df.sort_values(by='나이', ascending=True) # 결과 확인 print(sorted_df) Case 2: 데이터프레임 열(컬럼) 이름 변경하기 데이터프레임의 열 이름을 변.. 2023. 9. 19. pandas dataframe 데이터 필터링과 선택 pandas 라이브러리를 사용하여 데이터를 필터링하고 선택하는 방법을 다양한 케이스로 예시 코드와 함께 설명하겠습니다. Case 1: 조건을 사용하여 데이터 필터링하기 여러 행 중에서 특정 조건을 충족하는 행만 선택하는 경우입니다. import pandas as pd # 샘플 데이터프레임 생성 data = {'이름': ['Alice', 'Bob', 'Charlie', 'David'], '나이': [25, 30, 35, 28]} df = pd.DataFrame(data) # 나이가 30 이상인 행만 선택 filtered_df = df[df['나이'] >= 30] # 결과 확인 print(filtered_df) Case 2: 여러 조건을 조합하여 데이터 필터링하기 여러 조건을 조합하여 특정 행을 선택하는 경.. 2023. 9. 18. 파이썬 pandas SQL 데이터 저장하기와 불러오기 Pandas를 사용하여 SQL 데이터베이스에 데이터를 저장하고 불러오는 방법에 대한 예시 코드와 함께 설명하겠습니다. 이를 위해 SQLite 데이터베이스를 사용하는 예시를 제공하겠습니다. 1. SQL 데이터베이스에 데이터 저장하기 데이터프레임을 SQL 데이터베이스에 저장하기: 데이터프레임을 SQL 데이터베이스에 저장하려면 'to_sql' 메서드를 사용합니다. 아래는 이를 수행하는 예시 코드입니다. import pandas as pd import sqlite3 # 샘플 데이터프레임 생성 data = {'이름': ['Alice', 'Bob', 'Charlie'], '나이': [25, 30, 35]} df = pd.DataFrame(data) # SQLite 데이터베이스 연결 conn = sqlite3.con.. 2023. 9. 17. pandas 라이브러리 소개 및 데이터 불러오기 1. Pandas 라이브러리 소개 판다스(Pandas)는 파이썬 데이터 분석 및 조작을 위한 강력한 오픈 소스 라이브러리입니다. 판다스는 주로 두 가지 자료 구조를 제공합니다 Series: 1차원 데이터 배열로, 인덱스가 있는 배열입니다. 각 데이터 요소는 레이블링된 인덱스를 가집니다. DataFrame: 2차원 테이블 형태의 데이터 구조로, 행과 열이 있는 표 형태의 데이터를 다룹니다. 이 테이블은 여러 데이터 타입을 포함할 수 있습니다. Pandas는 데이터 불러오기, 필터링, 그룹화, 집계, 시각화 등 다양한 데이터 처리와 분석 작업을 지원합니다. 2. CSV 파일 저장 및 불러오기 CSV 파일 저장하기: import pandas as pd # 샘플 데이터프레임 생성 data = {'이름': ['A.. 2023. 9. 16. 이전 1 ··· 321 322 323 324 325 326 327 ··· 335 다음 반응형