안녕하세요 콥스랩(COBS LAB)입니다. 오늘 소개해드릴 주제는 데이터 시각화입니다.
데이터 시각화
데이터 시각화는 데이터 분석 과정에서 매우 중요한 요소 중 하나입니다. 시각화를 통해 데이터의 패턴이나 관계를 더 쉽게 파악할 수 있기 때문입니다. 판다스(Pandas)는 데이터 시각화를 위한 다양한 기능을 제공합니다.
import pandas as pd
import matplotlib.pyplot as plt
# 데이터 로드
df = pd.read_csv('data.csv')
선 그래프
먼저, 가장 기본적인 선 그래프(line plot)입니다..
plt.plot(df['x'], df['y'])
plt.show()
plt.plot() 함수를 사용해 df 데이터프레임의 x와 y 열을 이용해 선 그래프를 그려줍니다.
산점도
다음으로, 산점도(scatter plot)를 그려보겠습니다. 아래 코드는 df 데이터프레임의 x와 y 열을 이용해 산점도를 그리는 예제입니다.
plt.scatter(df['x'], df['y'], c=df['category'])
plt.show()
plt.scatter() 함수를 사용해 x와 y 열을 이용해 산점도를 그려줍니다. 여기서 산점도 그래프에 색상을 추가하는 방법을 보여줍니다. plt.scatter() 함수의 c 매개변수에 category 열을 전달하여 각각의 점에 대해 색상을 지정합니다.
막대 그래프
막대 그래프(bar plot)는 카테고리형 데이터를 시각화할 때 많이 사용됩니다.
plt.bar(df['category'], df['value'])
plt.show()
plt.bar() 함수를 사용해 df 데이터프레임의 category 열과 value 열을 이용해 막대 그래프를 그려줍니다.
plt.barh(df['category'], df['value'])
plt.show()
plt.barh() 함수를 사용하여 category 열을 y축으로, value 열을 x축으로 하는 수평 막대 그래프를 그립니다.
히스토그램
히스토그램(histogram)은 수치형 데이터를 시각화할 때 많이 사용됩니다. 아래 코드는 df 데이터프레임의 value 열을 이용해 히스토그램을 그리는 예제입니다.
plt.hist(df['value'])
plt.show()
plt.hist() 함수를 사용해 value 열을 이용해 히스토그램을 그립니다.
상자 그림
상자 그림(box plot)은 데이터의 분포를 시각화할 때 많이 사용됩니다. 아래 코드는 df 데이터프레임의 category 열과 value 열을 이용해 상자 그림을 그리는 예제입니다.
plt.boxplot(df.groupby('category')['value'].apply(list))
plt.show()
df.groupby() 함수를 사용해 category 열을 기준으로 데이터를 그룹화합니다. 그 다음에 groupby() 함수에 apply(list)를 적용하여 그룹별 value 열의 데이터를 리스트로 변환합니다. plt.boxplot() 함수는 변환된 데이터를 이용해 상자 그림을 그립니다. 마지막으로 plt.show() 함수를 사용해 그래프를 출력합니다.
파이 차트
마지막으로, 파이 차트(pie chart)를 그려보겠습니다. 파이 차트는 전체 데이터에서 각 항목이 차지하는 비율을 시각화할 때 사용됩니다. 각 항목이 전체 중에서 차지하는 비율을 파이 차트의 조각으로 표현합니다.
plt.pie(df.groupby('category')['value'].sum(),
labels=df.groupby('category')['value'].sum().index)
plt.show()
df 데이터프레임의 category 열과 value 열을 이용해 파이 차트를 그리는 예제입니다.
위 코드에서 groupby() 함수를 사용해 category 열을 기준으로 데이터를 그룹화하고, sum() 함수를 사용해 그룹별 value 열의 합을 구합니다. 이를 pie() 함수에 전달하여 파이 차트를 그립니다. labels 매개변수에는 각 항목의 레이블을 전달합니다.
'pandas' 카테고리의 다른 글
Matplotlib으로 효과적인 데이터 시각화 방법 익히기 (2) | 2023.03.24 |
---|---|
Seaborn을 활용한 데이터 시각화 - 깔끔하고 유용한 시각화 기법들 (0) | 2023.03.24 |
내림차순, 오름차순, 다중조건까지! 판다스로 데이터 정렬하기 (0) | 2023.03.23 |
Pandas로 데이터프레임 그룹화하기: 그룹별로 데이터 처리하는 방법 (0) | 2023.03.22 |
판다스(Pandas)로 피벗테이블(Pivot Table) 만들기: 데이터 분석의 필수 도구! (0) | 2023.03.22 |
댓글