본문 바로가기
Analysis/Time series

Lecture 5. 시계열 데이터 시각화

by 5ole 2021. 3. 15.

1. Y와 X의 관계를 보기위해, 특성 파악

2. 알고리즘의 결과를 냉정하게 판단하기 위해

 


 

  • Histogram 히스토그램

 

raw_fe.hist(bins=20, grid=True, figsize=(16,12))
plt.show()

 

 

  • Boxplot 박스플랏

 

raw_fe.boxplot(column='count', by='season', grid=True, figsize=(12,5))
plt.ylim(0,1000)

 

 

 

  • Scatter plot 산점도

 

raw_fe[raw_fe.workingday == 0].plot.scatter(y='count', x='Hour', c='temp', grid=True, figsize=(12,5), colormap='viridis')
plt.show()

 

 

 

  • 데이터 갯수 세기

 

raw_fe['weather'].value_counts()

 

 

  • Crosstab으로 각 갯수 보기 - margins 는 All로 총합 보여줌

 

pd.crosstab(index=raw_fe['count'], columns=raw_fe['weather'], margins=True)

 

 

  • 날씨와 요일별로 행 평균(mean) 구하기

 

raw_fe.groupby(['weather', 'DayofWeek']).mean()

 

 

  • 날씨와 요일별로 합, 최소값, 최대값 구하기

 

raw_fe.groupby(['weather', 'DayofWeek']).agg({'count':[sum, min, max]})

 

 

  • 날씨별로 groupby - key, items 로 나눌 수 있음

 

raw_fe.groupby('weather').groups.items()

 

 

  • correlation - 그래디언트로 상관관계 표시

 

raw_fe.corr().style.background_gradient().set_precision(2).set_properties(**{'font-size': '15pt'})

 

 

 

 

+ 참고 자료 및 출처

 

  • 김경원 < 파이썬을 활용한 시계열 데이터 분석 A-Z  강의 >  ( 패스트캠퍼스 강의 )

댓글