Python/Pandas

pandas.Series.str.contains로 문자열 포함 여부 확인하기

PySun 2025. 5. 26. 08:01
반응형

Pandas Series.str.contains: 문자열 포함 여부 확인하기

파이썬의 Pandas 라이브러리는 데이터 조작 및 분석을 위한 강력한 도구입니다. 그 중에서도 Series.str.contains 메서드는 시리즈의 각 요소에 대해 특정 문자열이 포함되어 있는지 쉽게 확인할 수 있는 유용한 기능입니다. 이 포스팅에서는 Series.str.contains 메서드의 사용법과 함께 여러 예제를 소개합니다.

Series.str.contains 기능 소개

Series.str.contains 메서드는 지정한 문자열이 각 요소에 포함되어 있는지를 boolean 형식으로 반환합니다. 이를 통해 데이터 분석 시 원하는 패턴의 존재 여부를 간편하게 체크할 수 있습니다.

메서드 시그니처

Series.str.contains(pat, case=True, na=False, regex=True)

매개변수:

  • pat: 포함 여부를 확인하고자 하는 문자열 패턴입니다.
  • case: 대소문자를 구분할지 여부를 결정합니다. 기본값은 True입니다.
  • na: NaN 값에 대해 반환할 값을 설정합니다. 기본값은 False입니다.
  • regex: pat이 정규 표현식인지 여부를 지정합니다. 기본값은 True입니다.

반환 값:

  • 각 요소에 대한 boolean 값을 가진 시리즈를 반환합니다.

사용 예제

기본 예제

다음은 Series.str.contains 메서드를 사용하여 특정 문자열이 포함되어 있는지 확인하는 간단한 예제입니다.

import pandas as pd

# 데이터 생성
data = {'이름': ['홍길동', '이순신', '강감찬', '유관순']}
df = pd.DataFrame(data)

# '이'가 포함된 이름 찾기
contains_i = df['이름'].str.contains('이')

print(contains_i)
# 출력:
# 0    False
# 1     True
# 2    False
# 3     True
# Name: 이름, dtype: bool

정규 표현식을 사용한 예제

정규 표현식을 사용하여 더 복잡한 패턴을 찾는 예제도 가능합니다.

import pandas as pd

# 데이터 생성
data = {'이름': ['홍길동', '이순신', '강감찬', '유관순']}
df = pd.DataFrame(data)

# 이름에 '강' 또는 '이'가 포함된 이름 찾기
contains_pattern = df['이름'].str.contains('강|이')

print(contains_pattern)
# 출력:
# 0     True
# 1     True
# 2     True
# 3    False
# Name: 이름, dtype: bool

결론

Series.str.contains 메서드는 특정 문자열의 포함 여부를 손쉽게 확인할 수 있어 데이터 처리 과정에서 매우 유용하게 활용됩니다. 데이터 분석 및 정제 작업에서 이 메서드를 활용하여 원하는 정보를 손쉽게 얻으세요!

  • 이 메서드를 통해 문자열 패턴을 확인하고 분석 효율성을 높여보세요!
  • 지금 바로 Series.str.contains를 활용하여 데이터 속성에 대한 깊은 통찰을 얻어보세요!
반응형