-
CobsLab upgrades your company value by AI technology
내림차순, 오름차순, 다중조건까지! 판다스로 데이터 정렬하기
데이터를 정렬하는 방법에는 크게 두 가지가 있습니다. 하나는 인덱스(index)를 기준으로 정렬하는 방법이고, 다른 하나는 특정 열(column)의 값을 기준으로 정렬하는 방법입니다. 먼저, 인덱스를 기준으로 데이터를 정렬하는 방법을 살펴보겠습니다. 설명에 쓸 데이터프레임(DataFrame) 예제입니다. data = {'name': ['Kim', 'Lee', 'Park', 'Choi', 'Jung'], 'age': [24, 26, 21, 27, 25], 'score': [90, 85, 95, 80, 75]} df = pd.DataFrame(data) 생성한 데이터프레임을 인덱스를 기준으로 오름차순으로 정렬했습니다. df_sorted = df.sort_index() print(df_sorted) >>> n..
2023. 3. 23.
Pandas로 데이터프레임 그룹화하기: 그룹별로 데이터 처리하는 방법
데이터프레임을 그룹화하고 집계하는 기능은 판다스에서 가장 많이 사용되는 기능 중 하나입니다. 이번에는 판다스 데이터프레임을 그룹화하는 방법에 대해서 알아보도록 하겠습니다. 데이터프레임 그룹화 판다스에서 데이터프레임을 그룹화하는 방법은 groupby() 함수를 사용하는 것입니다. groupby() 함수는 지정한 열(column)을 기준으로 데이터프레임을 그룹화합니다. 이후 집계(aggregation) 함수를 사용하여 각 그룹별로 데이터를 처리할 수 있습니다. data = {'name': ['Alice', 'Bob', 'Charlie', 'David', 'Eva', 'Frank'], 'gender': ['F', 'M', 'M', 'M', 'F', 'M'], 'age': [25, 32, 18, 47, 22, ..
2023. 3. 22.
판다스(Pandas)로 피벗테이블(Pivot Table) 만들기: 데이터 분석의 필수 도구!
안녕하세요 콥스랩(COBS LAB)입니다. 오늘 소개해드릴 주제는 피벗테이블에 대해서 설명드리도록 하겠습니다. Pivot table 피벗테이블은 데이터프레임(DataFrame)에서 하나 이상의 열(column)을 행(row) 인덱스로 설정하고 다른 열을 값으로 설정하여 데이터를 요약하는 방법입니다. 피벗테이블은 대규모 데이터셋에서 특정 데이터를 쉽게 분석하고 요약할 수 있습니다. data = { 'date': ['2020-01-01', '2020-01-02', '2020-01-02', '2020-01-03', '2020-01-03'], 'category': ['A', 'B', 'A', 'B', 'A'], 'value': [1, 2, 3, 4, 5] } df = pd.DataFrame(data) print..
2023. 3. 22.