본문 바로가기
Python/Pandas

pandas.drop으로 데이터 제거하기

by PySun 2025. 5. 9.
반응형

Pandas drop 함수: 데이터프레임에서 불필요한 데이터 쉽게 제거하기

데이터 분석의 세계에서 데이터를 정리하는 것은 무엇보다 중요합니다. Pandas 라이브러리의 drop 함수는 데이터프레임에서 특정 행이나 열을 손쉽게 제거할 수 있게 해주며, 데이터의 품질을 높이는 데 기여합니다. 이번 포스팅에서는 pandas.drop 함수의 기본 사용법과 예제를 소개합니다.

pandas.drop 함수 소개

마음에 드는 데이터만 남기고 불필요한 데이터를 제거하여 더 깔끔한 데이터프레임을 얻고 싶으신가요? drop 함수는 특정 라벨을 가진 행 또는 열을 삭제하는 강력한 도구입니다. 필요 없는 정보를 지우고 진정한 가치 있는 데이터만 남길 수 있게 도와줍니다.

함수 시그니처

DataFrame.drop(labels, axis=0, inplace=False)

매개변수:

  • labels: 제거할 행 또는 열의 라벨을 지정합니다.
  • axis: 제거할 축을 설정합니다. (0은 행, 1은 열을 의미합니다.)
  • inplace: 원본 데이터프레임을 수정할지 여부를 설정합니다. (기본값은 False)

반환 값:

  • 제거된 행이나 열이 없는 새로운 데이터프레임 또는 원본 데이터프레임을 반환합니다. (inplace가 True일 경우에는 반환하지 않음)

사용 예제

기본 예제

데이터프레임에서 특정 행을 제거하는 매우 간단한 예제를 살펴보겠습니다.

import pandas as pd

# 데이터프레임 생성
data = {
    '이름': ['Alice', 'Bob', 'Charlie'],
    '나이': [25, 30, 35],
    '도시': ['Seoul', 'Busan', 'Incheon']
}
df = pd.DataFrame(data)

# 행 제거
df_dropped = df.drop(1)  # 1번 행(Bob)을 제거합니다.

print(df_dropped)
# 출력:
#       이름  나이     도시
# 0   Alice  25    Seoul
# 2 Charlie  35  Incheon

열 제거 예제

이제 데이터프레임에서 특정 열을 제거하는 방법을 살펴봅시다.

import pandas as pd

# 데이터프레임 생성
data = {
    '이름': ['Alice', 'Bob', 'Charlie'],
    '나이': [25, 30, 35],
    '도시': ['Seoul', 'Busan', 'Incheon']
}
df = pd.DataFrame(data)

# 열 제거
df_dropped = df.drop('도시', axis=1)  # '도시' 열을 제거합니다.

print(df_dropped)
# 출력:
#       이름  나이
# 0   Alice  25
# 1     Bob  30
# 2 Charlie  35

결론

pandas.drop 함수는 데이터프레임에서 필요 없는 데이터를 처리할 수 있는 간편하고 강력한 방법입니다. 데이터를 정리하고 정제하여 더 명확한 분석을 위한 기초를 마련할 수 있습니다. 데이터의 품질을 향상시키기 위해 drop 함수를 사용해 보세요!

  • 유용하지 않은 데이터를 제거하여 분석 작업의 효율성을 높이세요!
  • 지금 pandas.drop 호출하여 데이터프레임을 깔끔하게 정리해 보세요!
반응형