ランダムフォレストの挙動について質問がありましたので、共有させていただきます。
質問:
ランダムフォレストで、予測変数の並び順を変えると予測結果が変わりますが、なぜでしょうか?
回答:
ランダムフォレストは、乱数を使ったアルゴリズムのため、本来は結果にある程度のばらつきがあります。
しかし、それでは現実的に困ったことになるため、Exploratoryでは、乱数のシードを固定することにより、同じ分析を複数回繰り返したときには同じ結果が再現するようにしています。
ただし、これで同じ結果が再現するためには、予測変数の列の並びを含めて、計算に関わる全てが同じである必要があります。
列の並びも、本質的な結果に影響を与える要素ではないものの、計算に関わる一つの要素ではありますので、入れ替わったときは、乱数を取り直したときと同程度の、ばらつきによる結果の変化が起きることになります。