Q: ランダムフォレストの予測精度を測るためにRMSEの目安はありますか?
A: ランダムフォレストで目的変数を数値にした場合や線形回帰などの予測モデルでは、モデルの精度を測るために「RMSE」といった実測値と予測値の平均的なズレの指標が使われます。
RMSEに目安があるかといった質問への回答ですが、目的変数の値のレンジ(範囲)によってもRMSEの値が大きいか小さいかは変わってくるため一概には言えません。
自社でRMSEの基準値があるのであればRMSEの利用で問題ないかと思いますが、そうでない場合は、目的変数の値のレンジに左右されない、「R2乗」という指標があります。
R2乗はデータの平均からのばらつきをモデルが説明できている割合の指標で、0から1の間の値を取ります。1に近ければ近いほど、モデルがデータのばらつきをよく説明できていることを示します。
予測をしていきたいようでしたら、テストデータ(未知のデータ)に対してR2乗が0.8以上あるといいかもしれません。
予測と検証についての詳細は、下記をご覧ください。