본문 바로가기
Python/Pandas

pandas dataframe 데이터 필터링과 선택

by PySun 2023. 9. 18.
반응형

pandas 라이브러리를 사용하여 데이터를 필터링하고 선택하는 방법을 다양한 케이스로 예시 코드와 함께 설명하겠습니다.

Case 1: 조건을 사용하여 데이터 필터링하기

여러 행 중에서 특정 조건을 충족하는 행만 선택하는 경우입니다.

import pandas as pd

# 샘플 데이터프레임 생성
data = {'이름': ['Alice', 'Bob', 'Charlie', 'David'],
        '나이': [25, 30, 35, 28]}

df = pd.DataFrame(data)

# 나이가 30 이상인 행만 선택
filtered_df = df[df['나이'] >= 30]

# 결과 확인
print(filtered_df)

Case 2: 여러 조건을 조합하여 데이터 필터링하기

여러 조건을 조합하여 특정 행을 선택하는 경우입니다.

import pandas as pd

# 샘플 데이터프레임 생성
data = {'이름': ['Alice', 'Bob', 'Charlie', 'David'],
        '나이': [25, 30, 35, 28],
        '성별': ['여', '남', '여', '남']}

df = pd.DataFrame(data)

# 여성이면서 나이가 30 이상인 행만 선택
filtered_df = df[(df['성별'] == '여') & (df['나이'] >= 30)]

# 결과 확인
print(filtered_df)

Case 3: 열(컬럼) 선택

원하는 열(컬럼)을 선택하여 데이터를 추출하는 경우입니다.

import pandas as pd

# 샘플 데이터프레임 생성
data = {'이름': ['Alice', 'Bob', 'Charlie', 'David'],
        '나이': [25, 30, 35, 28],
        '성별': ['여', '남', '여', '남']}

df = pd.DataFrame(data)

# '이름' 열만 선택
selected_column = df['이름']

# 결과 확인
print(selected_column)

Case 4: 여러 열(컬럼) 선택

여러 열(컬럼)을 선택하여 새로운 데이터프레임을 생성하는 경우입니다.

import pandas as pd

# 샘플 데이터프레임 생성
data = {'이름': ['Alice', 'Bob', 'Charlie', 'David'],
        '나이': [25, 30, 35, 28],
        '성별': ['여', '남', '여', '남']}

df = pd.DataFrame(data)

# '이름'과 '나이' 열 선택
selected_columns = df[['이름', '나이']]

# 결과 확인
print(selected_columns)

위의 예시 코드를 참고하여 판다스를 사용하여 데이터를 원하는 조건과 열에 따라 필터링하고 선택할 수 있습니다. 데이터프레임의 조건부 인덱싱 및 열 선택 기능을 활용하여 데이터를 조작하실 수 있습니다.

반응형