본문 바로가기
  • CobsLab upgrades your company value by AI technology

pandas21

다양한 그래프 유형으로 살펴보는 데이터 시각화! 안녕하세요 콥스랩(COBS LAB)입니다. 오늘 소개해드릴 주제는 데이터 시각화입니다. 데이터 시각화 데이터 시각화는 데이터 분석 과정에서 매우 중요한 요소 중 하나입니다. 시각화를 통해 데이터의 패턴이나 관계를 더 쉽게 파악할 수 있기 때문입니다. 판다스(Pandas)는 데이터 시각화를 위한 다양한 기능을 제공합니다. import pandas as pd import matplotlib.pyplot as plt # 데이터 로드 df = pd.read_csv('data.csv') 선 그래프 먼저, 가장 기본적인 선 그래프(line plot)입니다.. plt.plot(df['x'], df['y']) plt.show() plt.plot() 함수를 사용해 df 데이터프레임의 x와 y 열을 이용해 선 그래프를 그.. 2023. 3. 23.
Pandas로 데이터프레임 그룹화하기: 그룹별로 데이터 처리하는 방법 데이터프레임을 그룹화하고 집계하는 기능은 판다스에서 가장 많이 사용되는 기능 중 하나입니다. 이번에는 판다스 데이터프레임을 그룹화하는 방법에 대해서 알아보도록 하겠습니다. 데이터프레임 그룹화 판다스에서 데이터프레임을 그룹화하는 방법은 groupby() 함수를 사용하는 것입니다. groupby() 함수는 지정한 열(column)을 기준으로 데이터프레임을 그룹화합니다. 이후 집계(aggregation) 함수를 사용하여 각 그룹별로 데이터를 처리할 수 있습니다. data = {'name': ['Alice', 'Bob', 'Charlie', 'David', 'Eva', 'Frank'], 'gender': ['F', 'M', 'M', 'M', 'F', 'M'], 'age': [25, 32, 18, 47, 22, .. 2023. 3. 22.
판다스(Pandas)로 피벗테이블(Pivot Table) 만들기: 데이터 분석의 필수 도구! 안녕하세요 콥스랩(COBS LAB)입니다. 오늘 소개해드릴 주제는 피벗테이블에 대해서 설명드리도록 하겠습니다. Pivot table 피벗테이블은 데이터프레임(DataFrame)에서 하나 이상의 열(column)을 행(row) 인덱스로 설정하고 다른 열을 값으로 설정하여 데이터를 요약하는 방법입니다. 피벗테이블은 대규모 데이터셋에서 특정 데이터를 쉽게 분석하고 요약할 수 있습니다. data = { 'date': ['2020-01-01', '2020-01-02', '2020-01-02', '2020-01-03', '2020-01-03'], 'category': ['A', 'B', 'A', 'B', 'A'], 'value': [1, 2, 3, 4, 5] } df = pd.DataFrame(data) print.. 2023. 3. 22.
데이터 전처리에서 가장 중요한! 판다스(Pandas)의 데이터 타입 변경 방법 안녕하세요 콥스랩(COBS LAB)입니다. 오늘 소개해드릴 주제는 판다스 데이터 타입 변경에 대해서 설명하도록 하겠습니다. 데이터를 다룰 때 각 열(column)과 행(row)마다 데이터 타입이 다르기 때문에 데이터타입을 잘 이해하고 활용하는 것이 중요합니다. 1. object object 데이터타입은 일반적으로 문자열(string)을 나타냅니다. 예를 들어, 다음과 같은 데이터를 담고 있는 시리즈(Series)를 생성할 수 있습니다. data = {'name': ['John', 'Mike', 'Sarah', 'Kate'], 'age': [30, 25, 35, 27], 'gender': ['M', 'M', 'F', 'F']} df = pd.DataFrame(data) print(df.dtypes) nam.. 2023. 3. 21.