반응형

14.4 미국농무부 영양소 정보

USPA는 음식의 영양소 정보 데이터베이스를 제공하고 있다.

import json

db = json.load()

 

value_counts 메서드를 이용해서 음식 그룹의 분포를 확인할 수 있다.

 

14.5 2012년 연방선거관리 위원회 데이터베이스

unique()

 

14.5.1 직업 및 고용주에 따른 기분 통계

value_counts()

dict.get

 

14.5.2 기부금액

cut 함수를 사용해서 기부 규모별로 버킷을 만들어 기부자 수를 분할 하는 것이다.

 

14.5.3 주별 기부 통계

totals.div(totals.sum(1), axis = 0)

 

Apeendix A: 고급 Numpy

A.1 ndarray 객체 구조

ndarray는 다차원

dtype 자료형은 데이터가 실수 , 정수, 불리언 혹은 다른 형인지 알려주는 역할

ndarray가 유연한 까닭은 모든 배열 객체가 띄엄띄엄 떨어진 데이터 블록에 대한 뷰이기 때문이다.

 

import numpy as np

np.ones((10,5)).shape
np.ones((3,4,5),dtype = np.float64).strides

A.1.1 Numpy dtype구조

dtype 

np.uint16

np.float32

np.integer

np.floating

 

np.float64.mro() 

np.issubdtype(ints.dtype, np.number)

ints = np.ones(10, dtype = np.uint16)
np.issubdtype(ints.dtype, np.number)

 

A.2 고급 배열 조작 기법

 

A.2.1 배열 재형성하기

np.arange(8)

reshape((4,2))

 

flatten() 평탄화

반응형

' > python for Data Analysis' 카테고리의 다른 글

Apeendix-02  (0) 2021.03.06
Apeendix  (0) 2021.03.06
14-1. 데이터 분석 예제  (0) 2021.03.01
13-2. 파이썬 모델링 라이브러리  (0) 2021.03.01
12-2. 고급 pandas 13-1. 파이썬 모델링 라이브러리  (0) 2021.03.01

+ Recent posts