본문 바로가기
Python/Pandas

pandas pd.read_sql() 함수 활용하기

by PySun 2023. 11. 15.
반응형

pd.read_sql() 함수는 Pandas 라이브러리에서 제공하는 함수 중 하나로, SQL 데이터베이스에서 데이터를 불러와 데이터프레임으로 변환하는 데 사용됩니다. 이 함수를 사용하면 SQL 데이터베이스의 테이블에서 데이터를 선택하여 데이터프레임으로 가져올 수 있습니다.

함수 구문:

pd.read_sql(sql, con, index_col=None, coerce_float=True, params=None, parse_dates=None, columns=None, chunksize=None)

주요 매개변수:

  • sql: SQL 쿼리를 나타내는 문자열.
  • con: 데이터베이스 연결을 나타내는 SQLAlchemy 엔진 또는 데이터베이스 연결 문자열.
  • index_col: 인덱스로 사용할 열 번호 또는 열 이름을 지정합니다.
  • coerce_float: 부동 소수점 유형의 값을 자동으로 강제 변환할지 여부를 설정합니다. 기본값은 True입니다.
  • params: SQL 쿼리에 전달할 매개변수를 나타내는 딕셔너리.
  • parse_dates: 날짜 및 시간 열을 파싱하는 데 사용되는 열 또는 열 이름을 나타내는 리스트.
  • columns: 결과 데이터프레임의 열 이름을 나타내는 리스트. 열 이름을 직접 지정할 수 있습니다.
  • chunksize: 데이터를 청크로 나누어 읽을 때 각 청크의 크기를 설정합니다.

예시 코드:

import pandas as pd
from sqlalchemy import create_engine

# 데이터베이스 연결 생성
engine = create_engine('sqlite:///mydatabase.db')

# SQL 데이터베이스에서 데이터 불러오기
query = "SELECT * FROM mytable"
data = pd.read_sql(query, con=engine)

# 불러온 데이터프레임 출력
print(data)

이 예시 코드에서는 SQLite 데이터베이스에서 "mytable" 테이블의 모든 데이터를 불러와서 데이터프레임으로 저장합니다. 데이터베이스 연결 문자열 및 SQL 쿼리는 실제 데이터베이스 및 테이블에 맞게 수정해야 합니다. 불러온 데이터프레임은 변수 data에 저장되며, print(data)를 통해 데이터를 확인할 수 있습니다.

pd.read_sql() 함수는 다양한 데이터베이스 시스템과 연결을 지원하며, SQL 쿼리를 사용하여 데이터를 불러올 수 있습니다. SQLAlchemy 엔진을 사용하면 다양한 데이터베이스에 연결할 수 있으며, SQL 쿼리를 통해 데이터를 선택할 수 있습니다.

반응형