본문 바로가기
  • CobsLab upgrades your company value by AI technology

전체 글111

판다스(Pandas)로 피벗테이블(Pivot Table) 만들기: 데이터 분석의 필수 도구! 안녕하세요 콥스랩(COBS LAB)입니다. 오늘 소개해드릴 주제는 피벗테이블에 대해서 설명드리도록 하겠습니다. Pivot table 피벗테이블은 데이터프레임(DataFrame)에서 하나 이상의 열(column)을 행(row) 인덱스로 설정하고 다른 열을 값으로 설정하여 데이터를 요약하는 방법입니다. 피벗테이블은 대규모 데이터셋에서 특정 데이터를 쉽게 분석하고 요약할 수 있습니다. data = { 'date': ['2020-01-01', '2020-01-02', '2020-01-02', '2020-01-03', '2020-01-03'], 'category': ['A', 'B', 'A', 'B', 'A'], 'value': [1, 2, 3, 4, 5] } df = pd.DataFrame(data) print.. 2023. 3. 22.
Pandas merge, join, concat의 차이와 활용 예시 안녕하세요 콥스랩(COBS LAB)입니다. 오늘 소개해드릴 주제는 판다스 데이터프레임 병합에 대해서 설명드리도록 하겠습니다. 데이터프레임 합치기 판다스(Pandas)는 두 개 이상의 데이터프레임을 합치는 여러 가지 방법을 제공합니다. 이번에는 판다스를 사용하여 데이터프레임을 합치는 방법에 대해 알아보도록 하겠습니다. 데이터 합치기 판다스는 여러 개의 데이터 프레임을 합치는데에 유용한 다양한 함수를 제공합니다. 이번 예제에서는 concat(), merge(), join() 함수를 사용하여 데이터 프레임을 합치는 방법을 살펴보겠습니다. concat() concat() 함수는 여러 개의 데이터 프레임을 하나로 합치는 함수입니다. 합치는 방향을 지정하여 가로로 합치는 concat(axis=1)와 세로로 합치는 .. 2023. 3. 21.
데이터 전처리에서 가장 중요한! 판다스(Pandas)의 데이터 타입 변경 방법 안녕하세요 콥스랩(COBS LAB)입니다. 오늘 소개해드릴 주제는 판다스 데이터 타입 변경에 대해서 설명하도록 하겠습니다. 데이터를 다룰 때 각 열(column)과 행(row)마다 데이터 타입이 다르기 때문에 데이터타입을 잘 이해하고 활용하는 것이 중요합니다. 1. object object 데이터타입은 일반적으로 문자열(string)을 나타냅니다. 예를 들어, 다음과 같은 데이터를 담고 있는 시리즈(Series)를 생성할 수 있습니다. data = {'name': ['John', 'Mike', 'Sarah', 'Kate'], 'age': [30, 25, 35, 27], 'gender': ['M', 'M', 'F', 'F']} df = pd.DataFrame(data) print(df.dtypes) nam.. 2023. 3. 21.
이상치를 대체하는 다양한 방법, 판다스로 구현하기 안녕하세요 콥스랩(COBS LAB)입니다. 오늘 소개해드릴 주제는 판다스 데이터 탐색 단계에서 이상치에 대해서 설명하도록 하겠습니다. 데이터 탐색 시 이상치(outlier) 처리 방법은 매우 중요합니다. 이상치는 일반적인 패턴에서 벗어나는 값으로, 데이터 분석 결과를 왜곡시킬 수 있습니다. 따라서 이상치를 식별하고 처리하는 것은 데이터 분석 과정에서 필수적인 단계입니다. 데이터 탐색 데이터 탐색은 데이터를 분석하기 전에 필요한 과정으로, 데이터의 구조와 특성을 파악하는 과정입니다. 데이터 탐색을 통해 데이터의 결측치, 이상치, 분포, 상관관계 등을 확인할 수 있습니다. import pandas as pd data = pd.read_csv('data.csv') 이상치란? 이상치란, 일반적인 데이터 분포에서.. 2023. 3. 20.
Pandas의 Concat 함수를 활용한 데이터 프레임 병합 방법 보호되어 있는 글 입니다. 2023. 3. 20.
판다스로 데이터 전처리하기: 결측값과 중복값 처리 보호되어 있는 글 입니다. 2023. 3. 20.