Python/Pandas
pandas.read_csv로 CSV 파일 읽기
PySun
2025. 5. 19. 08:01
반응형
pandas.read_csv: CSV 파일을 읽는 가장 간편한 방법
파이썬의 강력한 데이터 처리 라이브러리인 Pandas는 일반적으로 데이터 분석 및 조작에 사용됩니다. 그 중에서도 pandas.read_csv 함수는 CSV(Comma-Separated Values) 형식의 파일을 간편하게 읽고 데이터 프레임으로 변환하는 데 탁월합니다. 이번 포스팅에서는 pandas.read_csv 함수의 사용법을 소개하고, 다양한 예제를 통해 그 활용법을 알아보겠습니다.
pandas.read_csv 함수 소개
pandas.read_csv 함수는 CSV 파일을 읽어 데이터 프레임을 생성합니다. 이는 데이터를 손쉽게 조작, 분석, 시각화할 수 있도록 돕는 역할을 합니다. 이 함수는 다양한 인자를 통해 CSV 파일의 포맷에 맞춰 알맞은 읽기를 지원합니다.
함수 시그니처
pandas.read_csv(filepath_or_buffer, sep=',', header='infer', names=None, ...)
주요 매개변수:
- filepath_or_buffer: 읽을 CSV 파일의 경로 또는 URL입니다.
- sep: 필드를 구분하는 구분자입니다 (기본값: ',').
- header: 컬럼명 행을 지정합니다 (기본값: 'infer').
- names: 데이터 프레임의 컬럼명을 지정할 때 사용합니다.
반환 값:
- CSV 파일 내용이 담긴 DataFrame 객체를 반환합니다.
사용 예제
기본 예제
여기서는 간단한 CSV 파일을 읽어 데이터를 데이터 프레임으로 변환하는 예제를 보여줍니다.
import pandas as pd
# CSV 파일 읽기
df = pd.read_csv('data.csv')
# 데이터 프레임 출력
print(df)
구분자 지정 예제
CSV 파일의 구분자가 쉼표가 아닌 다른 문자일 경우, 이를 지정할 수 있습니다. 다음은 탭(\t)으로 구분된 파일을 읽는 방법입니다.
import pandas as pd
# 탭으로 구분된 CSV 파일 읽기
df = pd.read_csv('data.tsv', sep='\t')
# 데이터 프레임 출력
print(df)
컬럼명 지정 예제
CSV 파일에 컬럼명이 포함되지 않은 경우, names 매개변수를 사용해 직접 컬럼명을 지정할 수 있습니다.
import pandas as pd
# 컬럼명이 없는 CSV 파일 읽기, 컬럼명 지정
df = pd.read_csv('data_no_header.csv', names=['Name', 'Age', 'Gender'])
# 데이터 프레임 출력
print(df)
결론
pandas.read_csv 함수는 CSV 파일을 쉽고 빠르게 데이터 프레임으로 변환하는 데 필수적인 도구입니다. 이를 통해 비즈니스 인사이트를 도출하고, 데이터를 분석하는 즐거움을 느낄 수 있습니다.
- pandas.read_csv를 통해 데이터를 손쉽게 불러오고, 분석의 첫 걸음을 내딛어 보세요!
- 주어진 CSV 파일을 활용하여 데이터의 세계에 빠져보세요!
반응형