파이썬/Code Solution

[Code Solution] 데이터프레임 특정 column/index 데이터 삭제하기

컴공돌이​ 2022. 6. 29. 12:50

데이터프레임 특정 column/index 데이터 삭제하기

데이터프레임 형태로 제공되는 데이터를 사용하다보면, 특정 column 또는 index의 데이터를 삭제해야하는 경우가 발생할 수 있습니다.

이러한 경우에는 pandas 라이브러리의 데이터프레임에 기본적으로 내장되어 있는 drop() 함수를 사용하면 손쉽게 특정 comlun 또는 index의 데이터 삭제가 가능합니다.

drop() 함수를 사용하여 데이터를 삭제하고 싶을 때, 특정 column의 데이터를 삭제하고 싶다면 내부에 column 이름 또는 column 이름으로 이루어진 리스트를 입력해준 후 axis 파라미터를 0으로 설정하면 되고, 특정 index의 데이터를 삭제하고 싶다면 내부에 index 이름 또는 index 이름으로 이루어진 리스트를 입력해준 후 axis 파라미터를 1으로 설정해주어야 합니다.

기본적으로 dataframe의 다양한 내장 함수들에서 axis 파라미터가 필요하다면 0은 column에 대하여 동작하고 1은 index에 대하여 동작한다고 이해하면 됩니다.

또한, drop() 함수에도 inplace 파라미터를 통하여 현재 데이터프레임에 해당작업을 수행할지, 혹은 해당작업을 수행 할 새로운 데이터프레임을 만들지를 결정해줄 수 있습니다.

inplcae 파라미터를 False라고 설정하면 새로운 데이터프레임가 생성되고, inplace 파라미터를 True로 설정하면 현재 데이터프레임에 작업을 수행합니다.

import pandas as pd

# 데이터프레임 생성
data = pd.Dataframe([[30, 'samsung'], [32, 'lg']], columns=['나이','소속'], index=['철수', '영희'])

# 특정 Column의 데이터 삭제
data.drop('나이', axis=1, inplace=True)

# 특정 Index의 데이터 삭제
data.drop('철수', axis=0, inplace=True)

python version: 3.7.13

 
반응형