【第1弾】SARIMAで時系列分析に挑戦【月別牛乳生産量の見える化から開始】
LSTMを利用して時系列データ分析に挑戦していたが、
今回からは、「SARIMA」を利用することにした。
ARIMAは、機械学習でもない従来からあった時系列データ分析の手法であるが、
そこそこの精度が出るため、ビジネスでもよく利用されているとのことだ。
最終的な目標は、LSTMとの精度を比較とする。
それでは本題に入りたい。
■時系列データは、月別の牛乳生産量
約60年前のデータではあるが、月別の牛乳生産量を用いる。
1962年1月から1975年12月までの約14年間で、レコード数は168行である。
図1.月別牛乳生産量の推移(1カ月単位)
■原系列、傾向変動、季節変動、不規則変動 (残差)に分解
原系列を基本成分に分解するために、seasonal_decompose() 関数を利用する。
・傾向変動(トレンド)は中長期的な増加・減少の変化
・季節変動は周期的な変化(例え:1 年)
・不規則変動は前者2個の変動に当てはまらない変化
Python: statsmodels で時系列データを基本成分に分解する - CUBE SUGAR CONTAINER (amedama.jp)
※さくっとトレンド抽出: Pythonのstatsmodelで時系列分析入門 - Gunosyデータ分析ブログ
図2.原系列、傾向変動、季節変動、不規則変動 (残差)
■次回
下記項目と自分の将来を見つめていきたい。
ん、、、自分の将来はここで見つめなくても良いのでは?
・pivot_table関数を利用して、月別牛乳生産量の可視化