본문 바로가기
반응형

전체 글2116

pandas dataframe 다중 조건에 따른 그룹화 판다스 라이브러리를 사용하여 다중 조건을 기반으로 데이터를 그룹화하는 다양한 케이스에 대한 예시 코드와 함께 설명하겠습니다. Case 1: 두 개의 열을 기준으로 그룹화하기 두 개의 열을 기준으로 데이터를 그룹화하고 각 그룹에 대한 통계를 계산하는 경우입니다. import pandas as pd # 샘플 데이터프레임 생성 data = {'과목': ['수학', '과학', '수학', '과학', '영어'], '성별': ['남', '여', '남', '여', '여'], '점수': [90, 85, 88, 92, 78]} df = pd.DataFrame(data) # '과목'과 '성별' 열을 기준으로 그룹화하여 평균 점수 계산 grouped = df.groupby(['과목', '성별'])['점수'].mean() # .. 2023. 9. 22.
pandas dataframe 그룹화 개념과 활용 판다스 라이브러리를 사용하여 데이터를 그룹화하고 그룹화된 데이터를 활용하는 다양한 케이스에 대한 예시 코드와 함께 설명하겠습니다. Case 1: 단일 열을 기준으로 그룹화하기 데이터를 단일 열을 기준으로 그룹화하고 각 그룹에 대한 통계를 계산하는 경우입니다. import pandas as pd # 샘플 데이터프레임 생성 data = {'과목': ['수학', '과학', '수학', '과학', '영어'], '점수': [90, 85, 88, 92, 78]} df = pd.DataFrame(data) # '과목' 열을 기준으로 그룹화하여 평균 점수 계산 grouped = df.groupby('과목')['점수'].mean() # 결과 확인 print(grouped) Case 2: 여러 열을 기준으로 그룹화하기 여러.. 2023. 9. 21.
pandas dataframe 결측치 처리 판다스 라이브러리를 사용하여 결측치(NaN)를 처리하는 다양한 케이스에 대한 예시 코드와 함께 설명하겠습니다. Case 1: 결측치 확인 데이터프레임에서 결측치를 확인하고 싶은 경우입니다. import pandas as pd import numpy as np # 샘플 데이터프레임 생성 (결측치 포함) data = {'A': [1, 2, np.nan, 4], 'B': [5, np.nan, 7, 8]} df = pd.DataFrame(data) # 결측치 확인 missing_values = df.isnull() # 결과 확인 print(missing_values) Case 2: 결측치 제거 데이터프레임에서 결측치를 제거하려는 경우입니다. import pandas as pd import numpy as np .. 2023. 9. 20.
pandas dataframe 데이터 정렬과 변환 판다스 라이브러리를 사용하여 데이터를 정렬하고 변환하는 다양한 케이스에 대한 예시 코드와 함께 설명하겠습니다. Case 1: 데이터프레임 정렬하기 데이터프레임을 특정 열(컬럼)을 기준으로 오름차순 또는 내림차순으로 정렬하는 경우입니다. import pandas as pd # 샘플 데이터프레임 생성 data = {'이름': ['Alice', 'Bob', 'Charlie'], '나이': [30, 25, 35]} df = pd.DataFrame(data) # '나이' 열을 기준으로 오름차순 정렬 sorted_df = df.sort_values(by='나이', ascending=True) # 결과 확인 print(sorted_df) Case 2: 데이터프레임 열(컬럼) 이름 변경하기 데이터프레임의 열 이름을 변.. 2023. 9. 19.
pandas dataframe 데이터 필터링과 선택 pandas 라이브러리를 사용하여 데이터를 필터링하고 선택하는 방법을 다양한 케이스로 예시 코드와 함께 설명하겠습니다. Case 1: 조건을 사용하여 데이터 필터링하기 여러 행 중에서 특정 조건을 충족하는 행만 선택하는 경우입니다. import pandas as pd # 샘플 데이터프레임 생성 data = {'이름': ['Alice', 'Bob', 'Charlie', 'David'], '나이': [25, 30, 35, 28]} df = pd.DataFrame(data) # 나이가 30 이상인 행만 선택 filtered_df = df[df['나이'] >= 30] # 결과 확인 print(filtered_df) Case 2: 여러 조건을 조합하여 데이터 필터링하기 여러 조건을 조합하여 특정 행을 선택하는 경.. 2023. 9. 18.
파이썬 pandas SQL 데이터 저장하기와 불러오기 Pandas를 사용하여 SQL 데이터베이스에 데이터를 저장하고 불러오는 방법에 대한 예시 코드와 함께 설명하겠습니다. 이를 위해 SQLite 데이터베이스를 사용하는 예시를 제공하겠습니다. 1. SQL 데이터베이스에 데이터 저장하기 데이터프레임을 SQL 데이터베이스에 저장하기: 데이터프레임을 SQL 데이터베이스에 저장하려면 'to_sql' 메서드를 사용합니다. 아래는 이를 수행하는 예시 코드입니다. import pandas as pd import sqlite3 # 샘플 데이터프레임 생성 data = {'이름': ['Alice', 'Bob', 'Charlie'], '나이': [25, 30, 35]} df = pd.DataFrame(data) # SQLite 데이터베이스 연결 conn = sqlite3.con.. 2023. 9. 17.
반응형