본문 바로가기
Python/Pandas

pandas pd.read_excel() 함수 활용하기

by PySun 2023. 11. 14.
반응형

pd.read_excel() 함수는 Pandas 라이브러리에서 제공하는 함수 중 하나로, Excel 파일을 불러와 데이터프레임으로 변환하는 데 사용됩니다. 이 함수는 데이터를 행과 열로 구성된 표 형식으로 읽어와서 데이터프레임으로 저장합니다.

함수 구문:

pd.read_excel(io, sheet_name=0, header=0, names=None, index_col=None, usecols=None, dtype=None, engine=None)

주요 매개변수:

io: Excel 파일의 경로, URL 또는 파일 객체를 나타내는 문자열 또는 파일 객체.

sheet_name: 불러올 시트의 이름 또는 인덱스. 기본값은 첫 번째 시트(0)입니다.

header: 열 이름을 지정하는 행 번호 (0부터 시작) 또는 None으로 설정하여 첫 번째 행을 열 이름으로 사용합니다.

names: 열 이름을 제공하는 리스트를 지정합니다.

index_col: 인덱스로 사용할 열 번호 또는 열 이름을 지정합니다.

usecols: 불러올 열의 인덱스 또는 열 이름을 제공하는 리스트.

dtype: 열의 데이터 타입을 지정하는 딕셔너리를 제공합니다.

engine: 엑셀 파일을 처리할 엔진을 선택합니다. 기본값은 'xlrd'입니다.

예시 코드:

import pandas as pd

# Excel 파일 불러오기
data = pd.read_excel('example.xlsx', sheet_name='Sheet1')

# 불러온 데이터프레임 출력
print(data)

이 예시 코드에서는 'example.xlsx' 파일의 'Sheet1' 시트를 불러와서 데이터프레임으로 저장합니다. 파일 경로와 시트 이름은 실제 파일 및 시트 이름으로 변경해야 합니다. 불러온 데이터프레임은 변수 data에 저장되며, print(data)를 통해 데이터를 확인할 수 있습니다.

pd.read_excel() 함수는 다양한 옵션과 설정을 사용하여 Excel 파일을 불러오고 데이터프레임으로 변환하는 데 사용됩니다. 필요에 따라 함수의 매개변수를 조절하여 데이터를 적절하게 처리할 수 있습니다.

반응형