반응형

9.2.1 선 그래프

s = pd.Series()

s.plot()

 

Series객체의 색인은 matplotlib에서 그래프를 생성할 때 x축으로 해석되며 use_index= False옵션을 넘겨서 색인을 그래프의 축으로 사용하는 것을 막을 수 있다.

x축의 눈금과 한계는 xticks와 xlim옵션으로 조절할 수있으며

y축 역시 yticks와 ylim옵션으로 조절할 수 있다.

 

DataFrame의 plot메서드는 하나의 서브플릿 안에서 각 컬럼별로 선그래프를 그리고 자동적으로 범례를 생성한다.

df = pd.DataFrame()

df.plot()

 

df.plot.line()과 동일

 

9.2.2 막대 그래프

plot.bar() 수직막대그래프 x눈금

plot.barh() 수평막대그래프 y눈금

 

누적막대그래프는 stacked  = True옵션을 사용해서 생성 , 각 로우의 값들이 하나의 막대에 누적되어 출력된다.

 

seaborn.barplot 메서드의 hue옵션을 이용하면 추가 분류에 따라 나눠 그릴 수 있다.

seaborn.set메서드를 이용

 

9.2.3 히스트그램과 밀도 그래프

Series의 plot.hist메서드

밀도 그래프 plot.ked 

plot.density()

 

sns.distplot메서드를 이용해서 히스트그램과 밀도 그래프를 한 번에 손 쉽게 그릴 수 있다.

양봉분포 bimodal distribution

 

9.2.4 산포도 

sns.replot 메서드를 이용해서 산포도와 선형회귀 곡선을 함께 그릴 수 있다.

pairplot " 짝지은 그래프 또는 선포도 행렬 

 

9.2.5 패싯 그리드와 범주형 데이터 

factorplot은 보여주고자 하는 목적에 어울리는 다른 종류의 그래프도 함께 지원한다.

상자그림 box plot

 

9.3 다른 파이썬 시각화 도구

 

 

10. 데이터 집계와 그룹 연산

데이터셋을 분류하고 각 그룹에 집계나 변형 같은 함수를 적용하는 건 데이터 분석 과정에서 무척 중요한 일이다.

데이터를 불러오고 취합해서 하나의 데이터 집합을 준비하고 나면 그룹 통계를 구하거나 가능하다면 피벗 테이블을 구해서 보고서를 만들거나 시각화하게 된다.

pandas는 데이터 집합을 자연스럽게 나누고 요약할 수 있는 groupby라는 유연한 방법을 제공한다.

 

관계형 데이터베이스와 SQL

 

10.1 GroupBy 메카닉

분리-적용-결합

groupby 

 

10.1.1 그룹간 순회하기

dict(list(df.groupby()))

 

10.1.2 컬럼이나 컬럼의 일부만 선택하기

GroupBy 객체를 컬럼 이름이나 컬럼 이름이 담긴 배열로 색인하면 수집을 위해 해당 컬럼을 선택하게 한다.

반응형

+ Recent posts