본문 바로가기
Python/Pandas

pandas pd.read_csv() 함수 활용하기

by PySun 2023. 11. 13.
반응형

pd.read_csv() 함수는 Pandas 라이브러리에서 제공하는 함수 중 하나로, CSV 파일을 불러와 데이터프레임으로 변환하는 데 사용됩니다. 이 함수는 데이터를 행과 열로 구성된 표 형식으로 읽어와서 데이터프레임으로 저장합니다.

함수 구문:

pd.read_csv(filepath_or_buffer, sep=',', delimiter=None, header='infer', names=None, index_col=None, usecols=None, dtype=None, encoding='utf-8')

주요 매개변수:

  • filepath_or_buffer: CSV 파일 경로 또는 URL을 나타내는 문자열.
  • sep 또는 delimiter: 열을 구분하는 문자 또는 정규 표현식 패턴. 기본값은 쉼표(,)입니다.
  • header: 열 이름을 지정하는 행 번호 (0부터 시작) 또는 None으로 설정하여 첫 번째 행을 열 이름으로 사용합니다.
  • names: 열 이름을 제공하는 리스트를 지정합니다.
  • index_col: 인덱스로 사용할 열 번호 또는 열 이름을 지정합니다.
  • usecols: 불러올 열의 인덱스 또는 열 이름을 제공하는 리스트.
  • dtype: 열의 데이터 타입을 지정하는 딕셔너리를 제공합니다.
  • encoding: 파일의 문자 인코딩을 지정합니다. 기본값은 'utf-8'입니다.

예시 코드:

import pandas as pd

# CSV 파일 불러오기
data = pd.read_csv('example.csv')

# 불러온 데이터프레임 출력
print(data)

이 예시 코드에서는 'example.csv' 파일을 불러와서 데이터프레임으로 저장합니다. 파일 경로는 실제 파일 위치로 변경해야 합니다. 불러온 데이터프레임은 변수 data에 저장되며, print(data)를 통해 데이터를 확인할 수 있습니다.

pd.read_csv() 함수는 다양한 옵션과 설정을 사용하여 CSV 파일을 불러오고 데이터프레임으로 변환하는 데 사용됩니다. 필요에 따라 함수의 매개변수를 조절하여 데이터를 적절하게 처리할 수 있습니다.

반응형