본문 바로가기
  • CobsLab upgrades your company value by AI technology

Python7

데이터 전처리에서 가장 중요한! 판다스(Pandas)의 데이터 타입 변경 방법 안녕하세요 콥스랩(COBS LAB)입니다. 오늘 소개해드릴 주제는 판다스 데이터 타입 변경에 대해서 설명하도록 하겠습니다. 데이터를 다룰 때 각 열(column)과 행(row)마다 데이터 타입이 다르기 때문에 데이터타입을 잘 이해하고 활용하는 것이 중요합니다. 1. object object 데이터타입은 일반적으로 문자열(string)을 나타냅니다. 예를 들어, 다음과 같은 데이터를 담고 있는 시리즈(Series)를 생성할 수 있습니다. data = {'name': ['John', 'Mike', 'Sarah', 'Kate'], 'age': [30, 25, 35, 27], 'gender': ['M', 'M', 'F', 'F']} df = pd.DataFrame(data) print(df.dtypes) nam.. 2023. 3. 21.
pandas 기초(13) - 데이터프레임 합치기 concat() 안녕하세요 콥스랩(COBS LAB)입니다. 오늘 소개해드릴 주제는 pandas입니다. 이번 시간에는 데이터 프레임을 합치는 concat 함수에 대해서 알아보도록 하겠습니다. 판다스 기초를 진행하면서 사용할 국내 아이돌 평판지수 데이터 프레임입니다. 데이터프레임을 합치기 위해서 복사본도 준비했습니다. df2 = df.copy() concat() 데이터프레임을 연결시켜주는 함수입니다. axis=0으로 두면 행을 기준으로 합칩니다. pd.concat([df, df2], axis=0) 데이터프레임양이 많아서 다 나오진 않았지만 df과 df2의 데이터프레임들이 행을 기준으로 합쳐졌습니다. pd.concat([df, df2], axis=1) df과 df2의 데이터프레임들이 을 기준으로 합쳐졌습니다. pd.conca.. 2023. 3. 15.
pandas 기초 (3) - pandas 인덱스 설정하는 법 안녕하세요 콥스랩(COBS LAB)입니다. 오늘 소개해드릴 주제는 pandas입니다. 이번시간에는 인덱스에 관해서 배워보도록 하겠습니다. 판다스 인덱스 데이터 프레임을 보면 인덱스를 새로 만들거나 수정해야 하는 상황이 있습니다. 이때 인덱스를 설정하는 방법을 배워보도록 하겠습니다. set_index set index 는 기존의 있던 행 인덱스를 제거하고 칼럼 중 하나를 인덱스로 설정하는 메소드입니다. 이때 기존의 인덱스는 사라집니다. 특정 칼럼을 Index로 설정하려면, 해당 칼럼을 set_index 메소드의 인자로 넣으면 됩니다. df = pd.DataFrame({'name': ['A','B','C','D','E','F'], 'age': [20,22,18,18,24,30], 'state': ['서울',.. 2023. 1. 19.