본문 바로가기
  • CobsLab upgrades your company value by AI technology
pandas

pandas 기초(10) - 결측값 정리하기 dropna 옵션 axis, how, inplace

by dmkdmk 2023. 2. 27.

안녕하세요 콥스랩(COBS LAB)입니다. 오늘 소개해드릴 주제는 pandas입니다. 이번 시간에는 저번 시간에 이어서 판다스 결측값 옵션에 대해서 알아보도록 하겠습니다.

 

판다스 기초를 진행하면서 사용할 국내 아이돌 평판지수 데이터 프레임입니다.

 

axis=0

결측값이 있는 칼럼행을 삭제해줍니다. default 값은 0입니다.

df.dropna(axis=0)

 

 

axis=1

df.dropna(axis=1)

결측값이 있는 열을 삭제해줍니다.

 

 

 

how='any'

행 또는 열에 결측값이 존재하는 값이 하나라도 있으면 삭제합니다. default 값은 'any'입니다.

df.dropna(axis=0, how='any')

how='all'

행 또는 열에 모든값이 결측값이면 삭제합니다.

df.dropna(axis=0, how='all')

 

inplace = True

dropna가 적용된 DataFrame 자체에 dropna를 적용해줍니다.

 

df.dropna(how='any', axis=0, inplace=True)

df

>>>

 

인덱스(행) 방향으로 결측값이 하나라도 포함된 행은 삭제되었습니다. 그리고 inplace = True 이므로 덮어쓰기 되었습니다.

 

 

inplace = False

dropna가 적용된 DataFrame는 그대로 두고 dropna를 적용한 DataFrame을 리턴해줍니다.

 

df.dropna(how='any', axis=1, inplace=False)

칼럼(열) 방향으로 결측값이 하나라도 포함된 칼럼(열)은 삭제되었습니다. 

 

df

>>>

 

inplace = False 이므로 원본 데이터(df) 메모리에 적용되지 않았습니다.

댓글