본문 바로가기
반응형

Python/Pandas76

pandas dataframe 엑셀 파일 불러오기 및 수정 판다스를 사용하여 엑셀 파일을 불러오고 수정하는 다양한 케이스에 대한 예시 코드와 함께 설명하겠습니다. Case 1: 엑셀 파일 불러오기 판다스를 사용하여 엑셀 파일을 불러오는 경우입니다. 엑셀 파일을 읽어 데이터프레임으로 변환할 수 있습니다. import pandas as pd # 엑셀 파일 불러오기 excel_file = '파일명.xlsx' df = pd.read_excel(excel_file) # 데이터프레임 내용 확인 print(df) Case 2: 데이터 수정 및 쓰기 불러온 엑셀 데이터를 수정하고 수정된 데이터를 새로운 엑셀 파일로 저장하는 경우입니다. import pandas as pd # 엑셀 파일 불러오기 excel_file = '파일명.xlsx' df = pd.read_excel(exc.. 2023. 9. 24.
pandas dataframe 집계 함수 활용 (sum, mean, count 등) 판다스 라이브러리를 사용하여 집계 함수 (sum, mean, count 등)를 활용하는 다양한 케이스에 대한 예시 코드와 함께 설명하겠습니다. Case 1: 데이터프레임의 열 합계 계산 데이터프레임에서 특정 열의 합계를 계산하는 경우입니다. import pandas as pd # 샘플 데이터프레임 생성 data = {'A': [1, 2, 3, 4], 'B': [5, 6, 7, 8]} df = pd.DataFrame(data) # 'A' 열의 합계 계산 sum_a = df['A'].sum() # 결과 확인 print(f"'A' 열의 합계: {sum_a}") Case 2: 그룹화된 데이터에 대한 집계 함수 사용 데이터를 그룹화하고 그룹별로 집계 함수를 사용하는 경우입니다. import pandas as pd.. 2023. 9. 23.
pandas dataframe 다중 조건에 따른 그룹화 판다스 라이브러리를 사용하여 다중 조건을 기반으로 데이터를 그룹화하는 다양한 케이스에 대한 예시 코드와 함께 설명하겠습니다. Case 1: 두 개의 열을 기준으로 그룹화하기 두 개의 열을 기준으로 데이터를 그룹화하고 각 그룹에 대한 통계를 계산하는 경우입니다. import pandas as pd # 샘플 데이터프레임 생성 data = {'과목': ['수학', '과학', '수학', '과학', '영어'], '성별': ['남', '여', '남', '여', '여'], '점수': [90, 85, 88, 92, 78]} df = pd.DataFrame(data) # '과목'과 '성별' 열을 기준으로 그룹화하여 평균 점수 계산 grouped = df.groupby(['과목', '성별'])['점수'].mean() # .. 2023. 9. 22.
pandas dataframe 그룹화 개념과 활용 판다스 라이브러리를 사용하여 데이터를 그룹화하고 그룹화된 데이터를 활용하는 다양한 케이스에 대한 예시 코드와 함께 설명하겠습니다. Case 1: 단일 열을 기준으로 그룹화하기 데이터를 단일 열을 기준으로 그룹화하고 각 그룹에 대한 통계를 계산하는 경우입니다. import pandas as pd # 샘플 데이터프레임 생성 data = {'과목': ['수학', '과학', '수학', '과학', '영어'], '점수': [90, 85, 88, 92, 78]} df = pd.DataFrame(data) # '과목' 열을 기준으로 그룹화하여 평균 점수 계산 grouped = df.groupby('과목')['점수'].mean() # 결과 확인 print(grouped) Case 2: 여러 열을 기준으로 그룹화하기 여러.. 2023. 9. 21.
pandas dataframe 결측치 처리 판다스 라이브러리를 사용하여 결측치(NaN)를 처리하는 다양한 케이스에 대한 예시 코드와 함께 설명하겠습니다. Case 1: 결측치 확인 데이터프레임에서 결측치를 확인하고 싶은 경우입니다. import pandas as pd import numpy as np # 샘플 데이터프레임 생성 (결측치 포함) data = {'A': [1, 2, np.nan, 4], 'B': [5, np.nan, 7, 8]} df = pd.DataFrame(data) # 결측치 확인 missing_values = df.isnull() # 결과 확인 print(missing_values) Case 2: 결측치 제거 데이터프레임에서 결측치를 제거하려는 경우입니다. import pandas as pd import numpy as np .. 2023. 9. 20.
pandas dataframe 데이터 정렬과 변환 판다스 라이브러리를 사용하여 데이터를 정렬하고 변환하는 다양한 케이스에 대한 예시 코드와 함께 설명하겠습니다. Case 1: 데이터프레임 정렬하기 데이터프레임을 특정 열(컬럼)을 기준으로 오름차순 또는 내림차순으로 정렬하는 경우입니다. import pandas as pd # 샘플 데이터프레임 생성 data = {'이름': ['Alice', 'Bob', 'Charlie'], '나이': [30, 25, 35]} df = pd.DataFrame(data) # '나이' 열을 기준으로 오름차순 정렬 sorted_df = df.sort_values(by='나이', ascending=True) # 결과 확인 print(sorted_df) Case 2: 데이터프레임 열(컬럼) 이름 변경하기 데이터프레임의 열 이름을 변.. 2023. 9. 19.
반응형