반응형

11.1.1 문자열을 datetime으로 변환하기

from datetime import datetime
stamp = datetime(2011, 1, 3)
str(stamp)
stamp.strftime('%Y-%m-%d')
from dateutil.parser import parse
parse('2011-01-03')

국제 로케일의 경우 날짜가 월 앞에 오는 경우가 매우 흔하다. dayfirst = True

 

pd.isnull()

 

 

11.2 시계열 기초

datetime객체로 표현하는 타임스탬프로 색인된 Series다.

 

11.2.1 색인 선택 부분 선택

truncate

 

11.2.2 중복된 색인을 갖는 시계열

is_unique 속성을 통해 확인해보면 색인이 유일하지 않음을 알 수 있다.

groupy(level=0)

 

11.3 날짜 범위 빈도 이동

pandas에서 일반적인 시계열은 불규칙적인 것으로 간주된다.

빈도 간 변환이나 리샘플링은 큰 주제이므로 다음에 따도 다루도록 하겠다.

 

11.3.1 날짜 범위 생성하기

pd.date_range

특정 빈도에 따라 지정한 길이만큼의 DatetimeIndex를 생성

date_range 일별 타임스탬프를 생성

pd.date_range('2012-04-02','2012-06-01')

pd.date_range('2012-04-02',periods = 20 )

빈도값 'BM'

pd.date_range('2012-04-02','2012-06-01', freq='BM')

normalize=True 정규화

 

11.3.2 빈도와 날짜 오프셋

기본빈도 base frequency

'M','H'

날짜 오프셋

from pandas.tseries.offsets import Hour, Minute

 

월별 주차

WOM으로 '월별 주차'

 

11.3.3 데이터 시프트

Series와 DataFrame은 색인은 변경하지 않고 데이터를 앞이나 뒤로 느슨한 시프트를 수행하는 shift메서드를 가지고 있다.

shift는 일반적으로 한 시계열 내에서  , 혹은 DataFrame의 컬럼으로 표현할 수 있는 여러 시계열에서의 퍼센트 변화를 계산할 때 흔히 사용하며

 

오프셋만큼 날짜 시프트하기

from pandas.tseries.offsets import Day,MonthEnd

rollforward

rollback

resample 

반응형

+ Recent posts