Python/Pandas

pandas.read_sql로 SQL 쿼리 결과 읽기

PySun 2025. 6. 20. 08:02
반응형

pandas.read_sql: SQL 쿼리 결과를 손쉽게 읽어보자!

데이터 과학과 분석의 세계에서 Pandas 라이브러리는 막대한 양의 데이터를 처리하는 데 필수적인 도구입니다. 그 중에서도 pandas.read_sql 함수는 SQL 데이터베이스에서 직접 데이터를 읽어오는 혁신적인 방법을 제공합니다. 이 포스팅에서는 pandas.read_sql의 작동 방식과 함께 실용적인 예제를 소개하겠습니다.

pandas.read_sql 함수 소개

pandas.read_sql 함수는 SQL 쿼리를 실행하고 결과를 DataFrame 객체로 반환합니다. 이를 통해 SQL 데이터베이스에서 가져온 데이터를 손쉽게 분석하고 변형할 수 있습니다. 데이터 엔지니어링 작업을 더 효율적이고 쉬운 것으로 만들어 줄 믿음직한 도구입니다.

함수 시그니처

pandas.read_sql(sql, con, ...)

매개변수:

  • sql: 실행할 SQL 쿼리 문자열입니다.
  • con: SQLAlchemy 연결 문자열 또는 SQLite 연결입니다.
  • 그 외 다수의 매개변수들이 존재하니, 필요에 따라 활용하세요!

반환 값:

  • DataFrame: 쿼리 결과로 생성된 데이터 프레임을 반환합니다.

사용 예제

기본 사용 예제

아래는 pandas.read_sql 함수를 이용해 SQL 쿼리 결과를 읽어오는 기본 예제입니다.

import pandas as pd
import sqlite3

# SQLite 데이터베이스 연결
connection = sqlite3.connect('example.db')

# SQL 쿼리
query = "SELECT * FROM users WHERE age > 30"

# SQL 쿼리 실행 및 결과를 DataFrame으로 반환
result_df = pd.read_sql(query, connection)

print(result_df)
# 데이터프레임 결과 출력

실제 데이터베이스에서 결과 읽기

이제 좀 더 복잡한 예제를 살펴보겠습니다. 아래 코드는 PostgreSQL 데이터베이스에서 데이터를 읽어오는 예제입니다.

from sqlalchemy import create_engine

# PostgreSQL 데이터베이스 연결 엔진 생성
engine = create_engine('postgresql://user:password@localhost/dbname')

# SQL 쿼리
query = "SELECT product_name, price FROM products WHERE price < 100"

# SQL 쿼리 실행 및 결과를 DataFrame으로 반환
result_df = pd.read_sql(query, engine)

print(result_df)
# 데이터프레임 결과 출력

결론

pandas.read_sql 함수는 SQL 데이터의 직접적인 접근성과 분석을 한층 쉽게 만들어 줍니다. 관계형 데이터베이스에서 데이터 분석으로의 원활한 흐름을 제공함으로써 데이터 과학의 가능성을 더욱 확장해줍니다.

  • pandas.read_sql를 활용하여 SQL 데이터와 손쉽게 연결해보세요!
  • 이제 당신의 데이터 분석 여정을 시작할 준비가 되었습니다. 도전해 보세요!
반응형