본문 바로가기
  • CobsLab upgrades your company value by AI technology

pandas30

pandas 기초(10) - 결측값 정리하기 dropna 옵션 axis, how, inplace 안녕하세요 콥스랩(COBS LAB)입니다. 오늘 소개해드릴 주제는 pandas입니다. 이번 시간에는 저번 시간에 이어서 판다스 결측값 옵션에 대해서 알아보도록 하겠습니다. 판다스 기초를 진행하면서 사용할 국내 아이돌 평판지수 데이터 프레임입니다. axis=0 결측값이 있는 칼럼행을 삭제해줍니다. default 값은 0입니다. df.dropna(axis=0) axis=1 df.dropna(axis=1) 결측값이 있는 열을 삭제해줍니다. how='any' 행 또는 열에 결측값이 존재하는 값이 하나라도 있으면 삭제합니다. default 값은 'any'입니다. df.dropna(axis=0, how='any') how='all' 행 또는 열에 모든값이 결측값이면 삭제합니다. df.dropna(axis=0, ho.. 2023. 2. 27.
pandas 기초(9) - 결측값 정리하기 dropna(), fillna() 안녕하세요 콥스랩(COBS LAB)입니다. 오늘 소개해드릴 주제는 pandas입니다. 이번 시간에는 판다스 결측값에 대해서 알아보도록 하겠습니다. 판다스 기초를 진행하면서 사용할 국내 아이돌 평판지수 데이터 프레임입니다. dropna() dropna()는 모든 칼럼 데이터 중 하나라도 결측값이 있다면, 그 행을 삭제합니다. df.dropna() 여기에서는 '강다니엘', '소연', '태연'행이 삭제되었습니다. df.dropna(subset =['칼럼']) 모든 칼럼이 아닌, 특정 칼럼의 결측값 데이터만 삭제할 수 있습니다. subset 을 이용해서 리스트 안에 칼럼 이름을 입력하면, 해당 칼럼들에 비어있는 값이 있을 경우 해당 행을 삭제합니다. df.dropna(subset =['키']) 여기서는 '키'칼.. 2023. 2. 22.
pandas 기초(8) - 결측값 확인하기 isna(), notna() 안녕하세요 콥스랩(COBS LAB)입니다. 오늘 소개해드릴 주제는 pandas입니다. 이번 시간에는 판다스 결측값에 대해서 알아보도록 하겠습니다. 판다스 기초를 진행하면서 사용할 국내 아이돌 평판지수 데이터 프레임입니다. 결측값(NaN) Not a Number의 약어로 표현 불가능한 수치형 결과입니다. 말 그대로 DataFrame의 누락된 데이터입니다. 파이썬에서는 NaN, NA, Null은 모두 같은 표현입니다. df.info() df.info()를 사용해서 데이터프레임의 정보를 확인할 수 있습니다. 데이터프레임의 전체 데이터 개수, 칼럼별 데이터 개수 및 타입 정보를 제공합니다. 여기서 non-null인 데이터 개수를 칼럼별로 제공하기 때문에 각 칼럼별 결측치를 확인할 수 있습니다. 여기서는 '그룹'.. 2023. 2. 1.
pandas 기초(7) - 칼럼 배우기 part 2 안녕하세요 콥스랩(COBS LAB)입니다. 오늘 소개해드릴 주제는 pandas입니다. 이번시간에는 저번시간에 이어서 데이터 프레임 칼럼에 대해서 알아보도록 하겠습니다. 데이터프레임 만들기 예제로 사용할 데이터 프레임입니다. data = [['A',20,'서울', 74], ['B',22,'부산', 84], ['C',18,'대구', 70], ['D',18,'포항', 90], ['E',24,'울산', 88], ['F',30,'광주', 97] ] df = pd.DataFrame(data=data) df 칼럼명이 없기 때문에 칼럼명을 각각 지정해 줬습니다. df.columns=['name','age','state','point'] >>> 칼럼명으로 데이터 선택 칼럼명이 'name'인 칼럼을 출력했습니다. df['.. 2023. 1. 31.