11.4 시간대 다루기
시간대를 처리하는 일은 시계열을 다루는 작업 중에서 가장 유쾌하지 않은 부분 중 하나다.
국제표준시 coordinated universal time UTC
pytz
pytz에서 시간대 객체를 얻으려면 pytz.timezone을 사용하면 된다.
11.4.1 시간대 지역화와 변환
pandas에서 시계열은 시간대를 엄격히 다루지 않는다.
지격화 시간으로의 변환은 tz_localize메서드
tz_convert 시간대로 변환 가능
11.4.2 시간대를 고려해서 Timestamp객체 다루기
Timestamp
11.4.3 다른 시간대 간의 연산
시간대 합치기 +
11.5 기간과 기간 연산
Period 클래스
pd.period_range()
11.5.1 Period의 번도 변환
기간과 PeriodIndex객체는 asfreq메서드를 통해 다른 빈도로 변환할 수 있다.
11.5.2 분기 빈도
Q-JAN
Q-DEC 202101- 201204
11.5.3 타임스탬프와 기간 서로 변환하기
to_period메서드
11.5.4 배열로 PeriodIndex 생성하기
PeriodIndex
11.6 리샘플링과 빈도 변환
리샘플링는 시계열의 빈도를 변환하는 과정을 일컫는다.
상위 빈도의 데이터를 하위 빈도로 집계하는 것을 다운 샘플링이라고 하며
반대 과정을 업샘플링이라고 한다.
resample
11.6.1 다운샘플링
시계열 데이터를 규칙적인 하위 빈도로 집계하는 일은 특별한 일이 아닌다.
집계할 데이터는 고정 빈도를 가질 필요가 없으며 잘라낸 시계열 조각의 크기를 원하는 빈도로 정의한다.
closed ='right' 시작값을 그룹의 오른쪽에 포함시킨다.
OHLC 리샘플링
ohlc()
'책 > python for Data Analysis' 카테고리의 다른 글
13-2. 파이썬 모델링 라이브러리 (0) | 2021.03.01 |
---|---|
12-2. 고급 pandas 13-1. 파이썬 모델링 라이브러리 (0) | 2021.03.01 |
11-2. 시계열 (0) | 2021.02.21 |
10-3. 데이터 집계와 그룹 연산 11-1. 시계열 (0) | 2021.02.19 |
10-2. 데이터 집계와 그룹 연산 (0) | 2021.02.18 |