본문 바로가기
Python/Pandas

pandas 라이브러리 소개 및 데이터 불러오기

by PySun 2023. 9. 16.
반응형

1. Pandas 라이브러리 소개

판다스(Pandas)는 파이썬 데이터 분석 및 조작을 위한 강력한 오픈 소스 라이브러리입니다. 판다스는 주로 두 가지 자료 구조를 제공합니다

  • Series: 1차원 데이터 배열로, 인덱스가 있는 배열입니다. 각 데이터 요소는 레이블링된 인덱스를 가집니다.
  • DataFrame: 2차원 테이블 형태의 데이터 구조로, 행과 열이 있는 표 형태의 데이터를 다룹니다. 이 테이블은 여러 데이터 타입을 포함할 수 있습니다.

Pandas는 데이터 불러오기, 필터링, 그룹화, 집계, 시각화 등 다양한 데이터 처리와 분석 작업을 지원합니다.

2. CSV 파일 저장 및 불러오기

  • CSV 파일 저장하기:
import pandas as pd

# 샘플 데이터프레임 생성
data = {'이름': ['Alice', 'Bob', 'Charlie'],
        '나이': [25, 30, 35]}

df = pd.DataFrame(data)

# 데이터프레임을 CSV 파일로 저장
df.to_csv('sample.csv', index=False)  # index=False로 설정하면 인덱스를 저장하지 않습니다.
  • CSV 파일 불러오기:
import pandas as pd

# CSV 파일을 데이터프레임으로 불러오기
df = pd.read_csv('sample.csv')

# 데이터프레임 내용 확인
print(df)

3. Excel 파일 저장 및 불러오기

  • Excel 파일 저장하기:
import pandas as pd

# 샘플 데이터프레임 생성
data = {'이름': ['Alice', 'Bob', 'Charlie'],
        '나이': [25, 30, 35]}

df = pd.DataFrame(data)

# 데이터프레임을 Excel 파일로 저장
df.to_excel('sample.xlsx', index=False)  # index=False로 설정하면 인덱스를 저장하지 않습니다.
  • Excel 파일 불러오기:
import pandas as pd

# Excel 파일을 데이터프레임으로 불러오기
df = pd.read_excel('sample.xlsx')

# 데이터프레임 내용 확인
print(df)

위 코드를 사용하면 데이터프레임을 CSV 및 Excel 파일로 저장하고, 저장한 파일을 다시 불러와서 데이터를 확인할 수 있습니다. 'to_csv' 및 'to_excel' 메서드를 사용하여 데이터프레임을 파일로 저장하고, 'read_csv' 및 'read_excel' 함수를 사용하여 파일을 데이터프레임으로 불러옵니다.

반응형