본문 바로가기
Python/Pandas

pandas df.set_index() 함수 활용하기

by PySun 2023. 12. 20.
반응형

set_index() 함수는 Pandas DataFrame에서 특정 열을 인덱스로 설정하는 데 사용됩니다. 이 함수를 사용하면 DataFrame의 기존 인덱스가 지정한 열로 대체됩니다. 여기에는 set_index() 함수에 대한 간단한 설명과 예시 코드가 있습니다.

set_index() 함수 설명:

DataFrame.set_index(keys, drop=True, append=False, inplace=False, verify_integrity=False)
  • keys: 새로운 인덱스로 사용할 열(들)의 이름이나 열의 리스트입니다.
  • drop: 기존의 인덱스 열을 DataFrame에서 삭제할지 여부를 나타내는 불리언 값입니다. 기본값은 True이며, False로 설정하면 기존의 인덱스 열이 DataFrame에 남아 있습니다.
  • append: 새로운 인덱스를 기존의 인덱스 앞에 추가할지 여부를 나타내는 불리언 값입니다. 기본값은 False이며, True로 설정하면 새로운 인덱스가 기존의 인덱스 앞에 추가됩니다.
  • inplace: DataFrame을 직접 수정할지 여부를 나타내는 불리언 값입니다. 기본값은 False이며, True로 설정하면 DataFrame이 직접 수정됩니다.
  • verify_integrity: 새로운 인덱스가 중복되지 않는지 검사할지 여부를 나타내는 불리언 값입니다. 기본값은 False이며, True로 설정하면 중복된 인덱스가 있는 경우 ValueError가 발생합니다.

예시 코드:

import pandas as pd

# 예시 DataFrame 생성
data = {'Name': ['Alice', 'Bob', 'Charlie', 'David'],
        'Age': [25, 30, 35, 40],
        'City': ['New York', 'San Francisco', 'Los Angeles', 'Chicago']}

df = pd.DataFrame(data)

print("Original DataFrame:")
print(df)

# 'Name' 열을 새로운 인덱스로 설정
df.set_index('Name', inplace=True)

print("\nDataFrame after set_index:")
print(df)

이 예시에서는 'Name' 열을 새로운 인덱스로 설정하고 있습니다. inplace=True로 설정하여 DataFrame이 직접 수정되도록 하였습니다. set_index() 함수를 사용하면 'Name' 열이 기존의 정수형 인덱스를 대체하게 됩니다.

반응형