Lecture 2. 시계열 알고리즘

알고리즘 선택 방법

1) 문제가 어디에 속하는지 -> "분석기획(가설/방향)" 가능
2) 알고리즘마다 입력은 무엇인지 -> "데이터전처리(준비)" 가능
3) 알고리즘마다 출력은 무엇인지 -> "결과해석(설명/검증)" 가능

Time series analysis 이 주로 사용하는 Algorithms

1) Regression

2) Regularization

3) Clustering

시계열에서 고려해야할 대표적 성분들 - Feature Engineering 방법 7가지

빈도(Frequency): 계절성 패턴(Seasonality)이 나타나기 전까지의 데이터 갯수로 사람이 정해야 함 (일,주,월,연 등)
추세(Trend, 𝑇𝑡): 시계열이 시간에 따라 증가, 감소 또는 일정 수준을 유지하는 경우
계절성(Seasonality, 𝑆𝑡): 일정한 빈도로 주기적으로 반복되는 패턴( $m$ ), 특정한 달/요일에 따라 기대값이 달라지는 것
주기(Cycle, 𝐶𝑡): 일정하지 않은 빈도로 발생하는 패턴(계절성)
시계열 분해(추세/계절성/잔차(Residual, 𝑒𝑡))
더미변수(Dummy Variables, 𝐷𝑖): 이진수(0 또는 1)의 형태로 변수를 생성
지연값(Lagged values, 𝐿𝑎𝑔𝑡(𝑋1)): 변수의 지연된 값을 독립변수로 반영하는 것으로, ARIMA/VAR/NNAR 등이 활용

+ 참고 자료 및 출처

5 O L E