[Python] pandas module - Time Series Data
import pandas as pd
- time series data는 Timestamp 형식의 index가 있는 데이터
- pandas DatatimeIndex class의 object로 생성 가능
*python standard library의 'datetime' module을 이용해서 구현됨
pd.to_datatime( [ date list ] )
- discrete한 년월일시분초
- 2021.2.4, 2021-02-04, 02/04/2021, Feb 4,2021 전부 가능
pd.date_range( )
- time range기반 정보
- periods (default : 매일)
- freq = 's'(초), 'T'(분), 'H'(시), 'D'(일), 'B'(workday), 'W'(일요일), 'W-Mon'(월요일), 'M'(매월 마지막날), 'MS'(매월 첫 날), 'BM'(매월 마지막 평일), 'BMS'(매월 첫 평일)
timestamp를 Series Data에 index로 입력
ts.truncate(before = '', after = '')
- 일부 데이터만 필터링해서 return, original data에는 영향없음
date column을 inde로 변환하기 위해서는.
- DataFrame선언 시 columns = ['date'] 설정 필요
- pd.to_datetime( df[ 'date' ] )로 Datetimeindex object 생성필요
- set_index
- df[ '2014' ], df[ '2014-05' ], df.loc['2014'] 등으로 select 가능