ランダムフォレストでボルータを使用した時に変数重要度がマイナスになるのはなぜでしょうか

ランダムフォレストでボルータを有効化した時に、重要度がマイナスになってしまうことがあります。

image

ボルータについての詳細は、こちらのセミナーをご覧ください。

ボルータで下位の変数の重要度の中央値が負になるのは、その変数が予測にほとんど役に立っていないためゼロ近辺で重要度が分布していて、それがばらつきによってたまたま負になったと考えるのが自然と思います。

複数ある変数の最下位近辺になると、たまたま重要度の中央値が負になった変数が最下位として表示されることになりますので、そういった結果は珍しくありません。

「いいね!」 1