반응형

11.4 시간대 다루기

시간대를 처리하는 일은 시계열을 다루는 작업 중에서 가장 유쾌하지 않은 부분 중 하나다.

국제표준시 coordinated universal time UTC

 

pytz

pytz에서 시간대 객체를 얻으려면 pytz.timezone을 사용하면 된다.

 

11.4.1 시간대 지역화와 변환

pandas에서 시계열은 시간대를 엄격히 다루지 않는다.

 

지격화 시간으로의 변환은 tz_localize메서드

tz_convert 시간대로 변환 가능

 

11.4.2 시간대를 고려해서 Timestamp객체 다루기

Timestamp

 

11.4.3 다른 시간대 간의 연산

시간대 합치기 +

 

 

11.5 기간과 기간 연산

Period 클래스 

pd.period_range()

 

11.5.1 Period의 번도 변환

기간과 PeriodIndex객체는 asfreq메서드를 통해 다른 빈도로 변환할 수 있다.

 

11.5.2 분기 빈도

Q-JAN 

Q-DEC 202101- 201204

 

11.5.3 타임스탬프와 기간 서로 변환하기

to_period메서드

 

11.5.4 배열로 PeriodIndex 생성하기

PeriodIndex 

 

11.6 리샘플링과 빈도 변환

리샘플링는 시계열의 빈도를 변환하는 과정을 일컫는다.

상위 빈도의 데이터를 하위 빈도로 집계하는 것을 다운 샘플링이라고 하며

반대 과정을 업샘플링이라고 한다.

resample

 

11.6.1 다운샘플링

시계열 데이터를 규칙적인 하위 빈도로 집계하는 일은 특별한 일이 아닌다.

집계할  데이터는 고정 빈도를 가질 필요가 없으며 잘라낸 시계열 조각의 크기를 원하는 빈도로 정의한다.

closed ='right' 시작값을 그룹의 오른쪽에 포함시킨다.

 

OHLC 리샘플링

ohlc()

 

반응형

+ Recent posts