Seaborn을 사용한 데이터 시각화
Seaborn
Seaborn은 matplotlib의 상위 레벨 라이브러리로서, matplotlib보다 간편한 API와 더 아름다운 기본 테마를 제공합니다. Seaborn은 통계 그래픽을 생성하기 위한 다양한 함수와 편리한 기능을 제공합니다.
Seaborn을 설치하려면 다음 명령어를 실행합니다:
pip install seaborn
다음은 Seaborn을 사용하여 시각화하는 예제 코드입니다.
import seaborn as sns
import matplotlib.pyplot as plt
set_theme()
set_theme() 함수는 Seaborn의 기본 설정을 변경하여 시각화를 통일된 스타일로 생성할 수 있도록 도와주는 함수입니다. Seaborn은 기본적으로 여러가지 테마를 제공하며, set_theme() 함수를 사용하면 이러한 테마 중 하나를 적용할 수 있습니다.
Seaborn의 set_theme() 함수를 호출하면, Seaborn의 기본 설정을 변경하여 전체 그래프에 적용됩니다. 예를 들어, 그래프의 배경색, 그리드 라인, 폰트 등이 변경됩니다. set_theme() 함수는 호출할 때 문자열 인수를 전달하여 사용할 테마를 선택할 수 있습니다.
# seaborn 기본 테마 설정
sns.set_theme()
다음은 Seaborn에서 제공하는 기본 테마의 목록입니다.
- darkgrid
- whitegrid
- dark
- white
- ticks
sns.load_dataset()
sns.load_dataset() 함수는 Seaborn에서 제공하는 예제 데이터셋을 불러올 때 사용하는 함수입니다. 이 함수를 사용하면 예제 데이터셋을 바로 다운로드하여 데이터프레임 형태로 불러올 수 있습니다.
# 데이터 불러오기
tips = sns.load_dataset("tips")
seaborn의 load_dataset() 함수를 사용하여 예제 데이터인 tips를 불러왔습니다.
sns.barplot()
sns.barplot() 함수는 Seaborn에서 제공하는 막대 그래프를 그리기 위한 함수입니다. sns.barplot() 함수를 사용하여 데이터셋의 변수들을 시각화할 수 있습니다.
# 요일별 팁 비율을 시각화
sns.barplot(x="day", y="tip", data=tips)
sns.barplot() 함수를 사용하여 요일별 팁 비율을 시각화해줍니다.
x 인수에는 x축에 표시할 컬럼을, y 인수에는 y축에 표시할 컬럼을 지정합니다. 여기서는 x="day", y="tip"으로 지정하여 요일별 팁 비율을 시각화하였습니다.
data 인수에는 시각화할 데이터프레임을 지정합니다. 여기서는 tips 데이터프레임을 사용하였습니다.
sns.barplot() 함수는 기본적으로 각 그룹의 평균값을 계산하여 막대 그래프를 그리며, 오차 막대(error bar)를 표시합니다. 만약 다른 통계량을 사용하고 싶다면 estimator 인수에 다른 함수를 전달할 수 있습니다. 또한, hue 인수를 사용하여 추가적인 범주형 변수를 추가하여 시각화할 수도 있습니다.
위 코드를 실행하면, tips 데이터셋에서 각 요일별 팁 비율을 막대 그래프로 시각화한 그래프가 생성됩니다.
plt.title()
plt.title() 함수는 Matplotlib에서 제공하는 함수로, 그래프의 제목을 설정하는 함수입니다. 이 함수를 사용하면 시각화한 그래프의 제목을 설정할 수 있습니다.
# 그래프 제목 설정
plt.title("Tip by Day")
여기서는 제목을 "Tip by Day"로 설정했습니다. 이 함수를 sns.barplot() 함수 호출 이후에 실행하면 그래프에 제목이 추가됩니다.
plt.title() 함수는 다양한 인수를 받아 그래프 제목을 설정할 수 있습니다. 예를 들어, fontsize 인수를 사용하여 제목의 폰트 크기를 설정할 수 있습니다. 또한, fontweight 인수를 사용하여 제목의 폰트 두께를 설정할 수도 있습니다. 이 외에도 color 인수를 사용하여 제목의 색상을 변경할 수 있습니다.
'pandas' 카테고리의 다른 글
람다(lambda) 함수와 함께하는 판다스(Pandas) apply() 메소드 활용법 (0) | 2023.03.27 |
---|---|
Matplotlib으로 효과적인 데이터 시각화 방법 익히기 (2) | 2023.03.24 |
다양한 그래프 유형으로 살펴보는 데이터 시각화! (0) | 2023.03.23 |
내림차순, 오름차순, 다중조건까지! 판다스로 데이터 정렬하기 (0) | 2023.03.23 |
Pandas로 데이터프레임 그룹화하기: 그룹별로 데이터 처리하는 방법 (0) | 2023.03.22 |
댓글