時系列予測 ARIMAについて

毎週金曜日のロト7の出目のデータです。

ARIMAで52週の予測をかけても、うまくいきません。

パラメーター設定が原因でしょうか?

Analytics%203_Forecasted

はじめまして。下記の部分について参考になれば幸いです。

結論から先に書くとパラメタの設定の問題でも、モデルの問題でもなく、データに問題があるように思えます。「ロト7の出目のデータ=宝くじ」の値は、おそらく何の規則もパターンも持たない出目が生成されるようにシステムが組まれていると思います。

つまり、この手のデータは、ARIMAモデルが過去から未来を予測するために必要な要素の1つである「自己相関」がない状態=ホワイトノイズのようなデータであるため、どのようなパラメタであれ、予測が上手くいかない、という結果になるかと思います。

ホワイトノイズを生成しARIMAモデルで予測すると、だいたいは画像のようになるかと思います。

12

このようになっていないのは、ExplratoryでARIMAを実行した際にAutoARIMAによってモデル選択が行われる中で、たまたまデータに存在していた傾向に引っ張られてモデルのパラメタが選択され、下降トレンドを持った予測が行われたものかと思います。

ホワイトノイズ(自己相関なし)やホワイトノイズの累積和で作られるランダムウォーク(自己相関ある)などの性質のデータでは予測が上手くいくことはないかと思います。

また、これはProphetにも当てはまるかとおもいます。Prophetは「トレンド」「季節効果」「休日効果」「外部変数効果」「誤差」の要素の和から値が生成されていると考えているモデルかと思います。こちらも同じく、データに規則、パターンがないのであればモデルが予測するのは困難かと思います。

「いいね!」 2

遅くなってすいません、勉強になりました。ありがとうございます!