seaborn라이브러리 - 데이터의 시각화
<<seaborn.pydata.org/tutorial/relational.html에 왠만한거는 다 있음>>
import seaborn as sns => 시본 불러오기
1.relplot
sns.relplot(data = , x=, y=, kind = )
-두종류의 데이터가 수치형데이터, 분포를 표현
-kind는 scatter와 line중에 선택가능
-hue는 옵션지정을 통해서 색상을 구별하고 싶은 내용을 설정
line 옵션
hue =sex
scatter옵션
2.joinplot
sns.jointplot(data=, x= , y = , kind=)
두개의 그래프를 통해 데이터의 분포를 표시
-kind 옵션은 'scatter', 'reg', 'kde', 'hex'
scatter
reg
kda
hex
3.pairplot
sns.pairplot(data= ,hue=)
-모든 수치형 데이터에서 두 컬럼씩 관계를 시각화
4.boxplot
-sns.boxplot(data=df, x=, y=, hue=)
-수치형와 카테고리형 데이터 분포
-박스안에 있는 선은 중위수를 나타냄
-점은 일반적이지 않는 데이터
5.swarmplot
sns.swarmplot(data=, x= , y= , hue=, dodge=True) # 닷지는 겹치는 부분 없이 표현
데이터의 개수와 분포를 확인
6.barplot
sns.barplot(data= df, x=, y=, hue=)
7.heatmap
sns.heatmap(data=, annot = True(숫자를 표시), fmt = '0.1f(소숫점)',cmap = 'Blues'(색상을변경))
-두 카테고리형 데이터 분포에 대한 수치형데이터의 값을 한눈에 색상을 이용하여 알 수 있음 =>피벗 테이블을 만듬
-색상 'RdBu_r' ->두개의 색상을 표현 _r은 뒤집어서 표현