알고리즘 선택 방법
1) 문제가 어디에 속하는지 -> "분석기획(가설/방향)" 가능
2) 알고리즘마다 입력은 무엇인지 -> "데이터전처리(준비)" 가능
3) 알고리즘마다 출력은 무엇인지 -> "결과해석(설명/검증)" 가능
Time series analysis 이 주로 사용하는 Algorithms
1) Regression
2) Regularization
3) Clustering
시계열에서 고려해야할 대표적 성분들 - Feature Engineering 방법 7가지
- 빈도(Frequency): 계절성 패턴(Seasonality)이 나타나기 전까지의 데이터 갯수로 사람이 정해야 함 (일,주,월,연 등)
- 추세(Trend, 𝑇𝑡): 시계열이 시간에 따라 증가, 감소 또는 일정 수준을 유지하는 경우
- 계절성(Seasonality, 𝑆𝑡): 일정한 빈도로 주기적으로 반복되는 패턴(𝑚), 특정한 달/요일에 따라 기대값이 달라지는 것
- 주기(Cycle, 𝐶𝑡): 일정하지 않은 빈도로 발생하는 패턴(계절성)
- 시계열 분해(추세/계절성/잔차(Residual, 𝑒𝑡))
- 더미변수(Dummy Variables, 𝐷𝑖): 이진수(0 또는 1)의 형태로 변수를 생성
- 지연값(Lagged values, 𝐿𝑎𝑔𝑡(𝑋1)): 변수의 지연된 값을 독립변수로 반영하는 것으로, ARIMA/VAR/NNAR 등이 활용
+ 참고 자료 및 출처
- 김경원 < 파이썬을 활용한 시계열 데이터 분석 A-Z 강의 > ( 패스트캠퍼스 강의 )
'Analysis > Time series' 카테고리의 다른 글
Lecture 5. 시계열 데이터 시각화 (0) | 2021.03.15 |
---|---|
Lecture 4. 시계열 데이터 분리 및 회귀분석 (0) | 2021.03.13 |
Lecture 3. 시계열 데이터 패턴 추출 (0) | 2021.03.13 |
Lecture 1. 시계열 데이터 기초 (0) | 2021.03.12 |
Lecture 0. 데이터 분석 사이클 (0) | 2021.03.10 |
댓글