データを期間で分けて予測モデルを作成し、別の期間のデータに対して予測をして精度を評価したい

アナリティクスビューの中でテストモードを実行すると、時系列は関係なしにランダムにサンプルされるようになっています。

2016~2018年のデータをトレーニングデータとし、2019年のデータに対して予測をして評価したいのであれば、2016~2018年、2019年のようにデータフレームを別々にしていただく必要があります。

2016~2019年までのデータが同じデータフレームにまとまっている場合は、下記のようにしていただくことで可能です。

データフレームのどこかのステップから「ブランチの作成」を実行します。

そのあとに、メインのデータフレームではフィルタのどれかに等しいで、年を選択します。

値には、2016, 2017, 2018のように設定します。

次に、ブランチデータフレームの方でフィルタをして、2019年のデータに絞り込みます。

あとは、2016~2018年のデータフレームの方で、アナリティクスビューからXGBoostなどの予測モデルを実行します。

最後に、2019年のデータフレームに対して予測をし、その精度を検証します。

別のデータフレームに対しての予測、検証については下記の資料をご参照ください。