楽しんで学習するITエンジニアの備忘録ブログ

~日常生活の中にも楽しみを見出したい~

【第1弾】SARIMAで時系列分析に挑戦【月別牛乳生産量の見える化から開始】

LSTMを利用して時系列データ分析に挑戦していたが、

 

今回からは、「SARIMA」を利用することにした。

 

ARIMAは、機械学習でもない従来からあった時系列データ分析の手法であるが、

 

そこそこの精度が出るため、ビジネスでもよく利用されているとのことだ。

 

最終的な目標は、LSTMとの精度を比較とする。

 

それでは本題に入りたい。

 

■時系列データは、月別の牛乳生産量

 

約60年前のデータではあるが、月別の牛乳生産量を用いる。

1962年1月から1975年12月までの約14年間で、レコード数は168行である。

 

f:id:takanarukodou2:20210706182147p:plain

        図1.月別牛乳生産量の推移(1カ月単位)
 

■原系列、傾向変動、季節変動、不規則変動 (残差)に分解

原系列を基本成分に分解するために、seasonal_decompose() 関数を利用する。

・傾向変動(トレンド)は中長期的な増加・減少の変化

・季節変動は周期的な変化(例え:1 年)

・不規則変動は前者2個の変動に当てはまらない変化

Python: statsmodels で時系列データを基本成分に分解する - CUBE SUGAR CONTAINER (amedama.jp)

※さくっとトレンド抽出: Pythonのstatsmodelで時系列分析入門 - Gunosyデータ分析ブログ

f:id:takanarukodou2:20210707000529p:plain

       図2.原系列、傾向変動、季節変動、不規則変動 (残差)

 

■次回

下記項目と自分の将来を見つめていきたい。

ん、、、自分の将来はここで見つめなくても良いのでは?

 
・pivot_table関数を利用して、月別牛乳生産量の可視化