본문 바로가기
Analysis/Time series

Lecture 2. 시계열 알고리즘

by 5ole 2021. 3. 13.

알고리즘 선택 방법

 

1) 문제가 어디에 속하는지 -> "분석기획(가설/방향)" 가능
2) 알고리즘마다 입력은 무엇인지 -> "데이터전처리(준비)" 가능
3) 알고리즘마다 출력은 무엇인지 -> "결과해석(설명/검증)" 가능

 


 

Time series analysis 이 주로 사용하는 Algorithms

 

1) Regression

2) Regularization

3) Clustering

 


 

시계열에서 고려해야할 대표적 성분들 - Feature Engineering 방법 7가지

 

  1. 빈도(Frequency): 계절성 패턴(Seasonality)이 나타나기 전까지의 데이터 갯수로 사람이 정해야 함 (일,주,월,연 등)
  2. 추세(Trend, 𝑇𝑡): 시계열이 시간에 따라 증가, 감소 또는 일정 수준을 유지하는 경우
  3. 계절성(Seasonality, 𝑆𝑡): 일정한 빈도로 주기적으로 반복되는 패턴(𝑚), 특정한 달/요일에 따라 기대값이 달라지는 것
  4. 주기(Cycle, 𝐶𝑡): 일정하지 않은 빈도로 발생하는 패턴(계절성)
  5. 시계열 분해(추세/계절성/잔차(Residual, 𝑒𝑡)) 
  6. 더미변수(Dummy Variables, 𝐷𝑖): 이진수(0 또는 1)의 형태로 변수를 생성
  7. 지연값(Lagged values, 𝐿𝑎𝑔𝑡(𝑋1)): 변수의 지연된 값을 독립변수로 반영하는 것으로, ARIMA/VAR/NNAR 등이 활용

 

 

 

+ 참고 자료 및 출처

 

  • 김경원 < 파이썬을 활용한 시계열 데이터 분석 A-Z  강의 >  ( 패스트캠퍼스 강의 )

댓글