정보 시각화는 데이터 분석에서 무척 중요한 일 하나다.
시각화는 특잇값을 찾아내거나, 데이터 변형이 필요한지 알아보거나, 모델에 대한 아이디어를 찾기 위한 과정의 일부이기도 하다.
웹상에서 구현되는 최종목표
matplotlib 2D 그래프를 위한 데스크톱 패키지로, 출판물 수준의 그래프를 만들어내도록 설계되였다.
IPython 셸 IPython 과 matplotlib
seaborn
%matplotlib notebook
9.1 matplotlib API 간략하게 살펴보기
import matplotlib.pyplot as plt
import matplotlib.pyplot as plt
%matplotlib notebook
import numpy as np
data = np.arange(10)
print(data)
plt.plot(data)
9.1.1 figure 와 서버플롯
fig = plt.figure()
ax1 = fig.add_subplot(2,2,1)
ax2 = fig.add_subplot(2,2,2)
ax3 = fig.add_subplot(2,2,3)
plt.plot(np.random.randn(50).cumsum(),'k--')
서브플롯 간의 간격 조절하기
간격 spacing
여백 padding
subplots_ajust 메서드를 사용해서 쉽게 바꿀 수 있다.
subplots_ajust(left = None, bottom = None, right= None, top = None, wspace = None, hspace = None)
wspace , hspace는 서블플롯 간의 간격을 위해 각각 figure의 너비와 높이에 대한 비융을 조절한다.
9.1.2 색상 마커 선 스타일
color
마커
linestyle ="dashed"
plt.legend
9.1.3 눈금 라벨 범례
xlim
xticks
xticklables
AxesSubplot 객체에 대해 동작
ax.get_xlim ax.set_xlim
제목 축이름 눈금 눈금 이름 설정하기
set_xticks : 전에 데이터 범위를 따라 눈금을 어디에 배치할 지 지정한다.
set_xticklabels : 다른 눈금 이름을 지정하고 싶을 경우
set_xlabel x축에 이름을 지정하고
set_title 메서드는 서블플롯의 제목을 지정한다.
범례 추가하기
레벨 인자를 넘기는 것이다.
ax.legend(loc = 'best')
label = '_nolegend_'
9.1.4 주석과 그림 추가하기
text, arrow, annotate함수를 사용해서 추가한다.
text함수는 그래프 내의 주어진 좌표(x,y)에 부가적인 스타일로 글자를 그려준다.
9.1.5 그래프를 파일로 저장하기
plt.savefig()
9.1.6 matplotlib 설정
plt.rc()
9.2 pandas에서 seaborn 으로 그래프 그리기
pandas를 사용하다 보면 로우와 컬럼 라벨을 가진 다양한 컬럼의 데이트를 다루게 된다.
seaborn 은 흔히 사용하는 다양한 시각화 패턴을 쉽게 구현할 수 있도록 도와준다.
'책 > python for Data Analysis' 카테고리의 다른 글
10-2. 데이터 집계와 그룹 연산 (0) | 2021.02.18 |
---|---|
09-2. 그래프와 시각화 10-1. 데이터 집계와 그룹 연산 (0) | 2021.02.17 |
08-2. 데이터 준비하기: 조인 병합 변형 (0) | 2021.02.09 |
07-2. 데이터 정제 및 준비 08-1. 데이터 준비하기: 조인 병합 변형 (0) | 2021.02.07 |
07-1. 데이터 정제 및 준비 (0) | 2021.02.07 |