반응형
1. Pandas 라이브러리 소개
판다스(Pandas)는 파이썬 데이터 분석 및 조작을 위한 강력한 오픈 소스 라이브러리입니다. 판다스는 주로 두 가지 자료 구조를 제공합니다
- Series: 1차원 데이터 배열로, 인덱스가 있는 배열입니다. 각 데이터 요소는 레이블링된 인덱스를 가집니다.
- DataFrame: 2차원 테이블 형태의 데이터 구조로, 행과 열이 있는 표 형태의 데이터를 다룹니다. 이 테이블은 여러 데이터 타입을 포함할 수 있습니다.
Pandas는 데이터 불러오기, 필터링, 그룹화, 집계, 시각화 등 다양한 데이터 처리와 분석 작업을 지원합니다.
2. CSV 파일 저장 및 불러오기
- CSV 파일 저장하기:
import pandas as pd
# 샘플 데이터프레임 생성
data = {'이름': ['Alice', 'Bob', 'Charlie'],
'나이': [25, 30, 35]}
df = pd.DataFrame(data)
# 데이터프레임을 CSV 파일로 저장
df.to_csv('sample.csv', index=False) # index=False로 설정하면 인덱스를 저장하지 않습니다.
- CSV 파일 불러오기:
import pandas as pd
# CSV 파일을 데이터프레임으로 불러오기
df = pd.read_csv('sample.csv')
# 데이터프레임 내용 확인
print(df)
3. Excel 파일 저장 및 불러오기
- Excel 파일 저장하기:
import pandas as pd
# 샘플 데이터프레임 생성
data = {'이름': ['Alice', 'Bob', 'Charlie'],
'나이': [25, 30, 35]}
df = pd.DataFrame(data)
# 데이터프레임을 Excel 파일로 저장
df.to_excel('sample.xlsx', index=False) # index=False로 설정하면 인덱스를 저장하지 않습니다.
- Excel 파일 불러오기:
import pandas as pd
# Excel 파일을 데이터프레임으로 불러오기
df = pd.read_excel('sample.xlsx')
# 데이터프레임 내용 확인
print(df)
위 코드를 사용하면 데이터프레임을 CSV 및 Excel 파일로 저장하고, 저장한 파일을 다시 불러와서 데이터를 확인할 수 있습니다. 'to_csv' 및 'to_excel' 메서드를 사용하여 데이터프레임을 파일로 저장하고, 'read_csv' 및 'read_excel' 함수를 사용하여 파일을 데이터프레임으로 불러옵니다.
반응형
'Python > Pandas' 카테고리의 다른 글
pandas dataframe 결측치 처리 (0) | 2023.09.20 |
---|---|
pandas dataframe 데이터 정렬과 변환 (0) | 2023.09.19 |
pandas dataframe 데이터 필터링과 선택 (0) | 2023.09.18 |
파이썬 pandas SQL 데이터 저장하기와 불러오기 (0) | 2023.09.17 |
파이썬 독학 커리큘럼 - Pandas (0) | 2023.08.22 |