본문 바로가기
  • CobsLab upgrades your company value by AI technology

pandas 기초7

pandas 기초(8) - 결측값 확인하기 isna(), notna() 안녕하세요 콥스랩(COBS LAB)입니다. 오늘 소개해드릴 주제는 pandas입니다. 이번 시간에는 판다스 결측값에 대해서 알아보도록 하겠습니다. 판다스 기초를 진행하면서 사용할 국내 아이돌 평판지수 데이터 프레임입니다. 결측값(NaN) Not a Number의 약어로 표현 불가능한 수치형 결과입니다. 말 그대로 DataFrame의 누락된 데이터입니다. 파이썬에서는 NaN, NA, Null은 모두 같은 표현입니다. df.info() df.info()를 사용해서 데이터프레임의 정보를 확인할 수 있습니다. 데이터프레임의 전체 데이터 개수, 칼럼별 데이터 개수 및 타입 정보를 제공합니다. 여기서 non-null인 데이터 개수를 칼럼별로 제공하기 때문에 각 칼럼별 결측치를 확인할 수 있습니다. 여기서는 '그룹'.. 2023. 2. 1.
pandas 기초(7) - 칼럼 배우기 part 2 안녕하세요 콥스랩(COBS LAB)입니다. 오늘 소개해드릴 주제는 pandas입니다. 이번시간에는 저번시간에 이어서 데이터 프레임 칼럼에 대해서 알아보도록 하겠습니다. 데이터프레임 만들기 예제로 사용할 데이터 프레임입니다. data = [['A',20,'서울', 74], ['B',22,'부산', 84], ['C',18,'대구', 70], ['D',18,'포항', 90], ['E',24,'울산', 88], ['F',30,'광주', 97] ] df = pd.DataFrame(data=data) df 칼럼명이 없기 때문에 칼럼명을 각각 지정해 줬습니다. df.columns=['name','age','state','point'] >>> 칼럼명으로 데이터 선택 칼럼명이 'name'인 칼럼을 출력했습니다. df['.. 2023. 1. 31.
pandas 기초(5) - 데이터 프레임 정렬하기 안녕하세요 콥스랩(COBS LAB)입니다. 오늘 소개해드릴 주제는 pandas입니다. 이번시간에는 데이터 프레임을 정렬하기 위해서 필요한 함수 sort_index와 sort_value에 대해서 알아보도록 하겠습니다. 예제용 데이터프레임입니다. df = pd.DataFrame({'name': ['A','B','C','D','E','F'], 'age': [20,22,18,18,24,30], 'state': ['서울','부산','대구','포항','울산','광주'], 'point': [74,84,70,90,88,97]} ) df >>> 1. sort_index sort_index는 인덱스 값을 기준으로 정렬하는 방법입니다. df.sort_index() >>> 아무 값도 넣지 않고 실행하면 index기준으로 오름.. 2023. 1. 28.