1. Y와 X의 관계를 보기위해, 특성 파악
2. 알고리즘의 결과를 냉정하게 판단하기 위해
- Histogram 히스토그램
raw_fe.hist(bins=20, grid=True, figsize=(16,12))
plt.show()
- Boxplot 박스플랏
raw_fe.boxplot(column='count', by='season', grid=True, figsize=(12,5))
plt.ylim(0,1000)
- Scatter plot 산점도
raw_fe[raw_fe.workingday == 0].plot.scatter(y='count', x='Hour', c='temp', grid=True, figsize=(12,5), colormap='viridis')
plt.show()
- 데이터 갯수 세기
raw_fe['weather'].value_counts()
- Crosstab으로 각 갯수 보기 - margins 는 All로 총합 보여줌
pd.crosstab(index=raw_fe['count'], columns=raw_fe['weather'], margins=True)
- 날씨와 요일별로 행 평균(mean) 구하기
raw_fe.groupby(['weather', 'DayofWeek']).mean()
- 날씨와 요일별로 합, 최소값, 최대값 구하기
raw_fe.groupby(['weather', 'DayofWeek']).agg({'count':[sum, min, max]})
- 날씨별로 groupby - key, items 로 나눌 수 있음
raw_fe.groupby('weather').groups.items()
- correlation - 그래디언트로 상관관계 표시
raw_fe.corr().style.background_gradient().set_precision(2).set_properties(**{'font-size': '15pt'})
+ 참고 자료 및 출처
- 김경원 < 파이썬을 활용한 시계열 데이터 분석 A-Z 강의 > ( 패스트캠퍼스 강의 )
'Analysis > Time series' 카테고리의 다른 글
Lecture 7. 잔차진단 (0) | 2021.03.16 |
---|---|
Lecture 6. 분석성능 확인 (0) | 2021.03.16 |
Lecture 4. 시계열 데이터 분리 및 회귀분석 (0) | 2021.03.13 |
Lecture 3. 시계열 데이터 패턴 추출 (0) | 2021.03.13 |
Lecture 2. 시계열 알고리즘 (0) | 2021.03.13 |
댓글