Python/Pandas
pandas.read_sql로 SQL 쿼리 결과 읽기
PySun
2025. 6. 20. 08:02
반응형
pandas.read_sql: SQL 쿼리 결과를 손쉽게 읽어보자!
데이터 과학과 분석의 세계에서 Pandas 라이브러리는 막대한 양의 데이터를 처리하는 데 필수적인 도구입니다. 그 중에서도 pandas.read_sql 함수는 SQL 데이터베이스에서 직접 데이터를 읽어오는 혁신적인 방법을 제공합니다. 이 포스팅에서는 pandas.read_sql의 작동 방식과 함께 실용적인 예제를 소개하겠습니다.
pandas.read_sql 함수 소개
pandas.read_sql 함수는 SQL 쿼리를 실행하고 결과를 DataFrame 객체로 반환합니다. 이를 통해 SQL 데이터베이스에서 가져온 데이터를 손쉽게 분석하고 변형할 수 있습니다. 데이터 엔지니어링 작업을 더 효율적이고 쉬운 것으로 만들어 줄 믿음직한 도구입니다.
함수 시그니처
pandas.read_sql(sql, con, ...)
매개변수:
- sql: 실행할 SQL 쿼리 문자열입니다.
- con: SQLAlchemy 연결 문자열 또는 SQLite 연결입니다.
- 그 외 다수의 매개변수들이 존재하니, 필요에 따라 활용하세요!
반환 값:
- DataFrame: 쿼리 결과로 생성된 데이터 프레임을 반환합니다.
사용 예제
기본 사용 예제
아래는 pandas.read_sql 함수를 이용해 SQL 쿼리 결과를 읽어오는 기본 예제입니다.
import pandas as pd
import sqlite3
# SQLite 데이터베이스 연결
connection = sqlite3.connect('example.db')
# SQL 쿼리
query = "SELECT * FROM users WHERE age > 30"
# SQL 쿼리 실행 및 결과를 DataFrame으로 반환
result_df = pd.read_sql(query, connection)
print(result_df)
# 데이터프레임 결과 출력
실제 데이터베이스에서 결과 읽기
이제 좀 더 복잡한 예제를 살펴보겠습니다. 아래 코드는 PostgreSQL 데이터베이스에서 데이터를 읽어오는 예제입니다.
from sqlalchemy import create_engine
# PostgreSQL 데이터베이스 연결 엔진 생성
engine = create_engine('postgresql://user:password@localhost/dbname')
# SQL 쿼리
query = "SELECT product_name, price FROM products WHERE price < 100"
# SQL 쿼리 실행 및 결과를 DataFrame으로 반환
result_df = pd.read_sql(query, engine)
print(result_df)
# 데이터프레임 결과 출력
결론
pandas.read_sql 함수는 SQL 데이터의 직접적인 접근성과 분석을 한층 쉽게 만들어 줍니다. 관계형 데이터베이스에서 데이터 분석으로의 원활한 흐름을 제공함으로써 데이터 과학의 가능성을 더욱 확장해줍니다.
- pandas.read_sql를 활용하여 SQL 데이터와 손쉽게 연결해보세요!
- 이제 당신의 데이터 분석 여정을 시작할 준비가 되었습니다. 도전해 보세요!
반응형