楽しんで学習するITエンジニアの備忘録ブログ

~日常生活の中にも楽しみを見出したい~

【第5弾】LSTMで時系列分析に挑戦【千葉県の人数予測】

時系列データ分析を通して、LSTMの理解に努めている。

 

■時系列データは、千葉県の人数推移

時系列データは、e-Statが公開している「 男女別人口-全国,都道府県(大正9年~平成27年)」である。その中で、千葉県の人数のみを抜き出して予測することにした。

大正9年は、約133万人。

平成22年は、約621.6万人。

平成27年は、約622.2万人。

平成時代は、大正時代と比較すると人口が約5倍以上になっていることが分かる。

また、昨今は人数は横ばい傾向になっていそうな感じがする。

https://www.e-stat.go.jp/stat-search/files?page=1&layout=datalist&toukei=00200521&tstat=000001011777&cycle=0&tclass1=000001094741&result_page=1&tclass2val=0

e-Stat:日本の統計が閲覧できる政府統計ポータルサイト

f:id:takanarukodou2:20210705201421p:plain

       図1.千葉県の人数推移(大正9年平成27年)※5年間隔
 

■千葉県の人数の予測

特にパラメータチューニングなどはやっていないが、それなりに高い精度で予測できているのではないかと勝手に考えている。

なお、横軸は正しく設定していないが、大正9年平成27年の5年間隔。

f:id:takanarukodou2:20210705202254p:plain

          図2.千葉県の人数予測(大正9年平成27年


  ※青線が正解、オレンジ線が予測値

  ※赤い点線の左側は学習データ、右側は検証データに対する処理

 

■別のデータにするか、手段をARIMAに変更するか?

 別のデータを見つけて適用してみたい。

 また、ARIMAのプログラムについてもそろそろ見ていきたい。