変数重要度はPermutation Importanceという手法を使用しています。
変数重要度については、下記のセミナーにて詳しく紹介しておりますので、そちらをご参考ください。
具体的な計算式に興味がある場合は、下記のページが参考になるかと思います。
また、テキストでの概念の説明としては、下記のような形で紹介すると良いかもしれません。
- 1つの予測変数を除いて(厳密にはシャッフルして)モデルを作り、除かなかった場合に比べて予測精度がどれだけ悪くなるのかを計算する。
- これを全ての変数で繰り返す。
- どれだけ予測精度が悪くなるのかというスコアをもとに、それぞれの変数の相対的な重要度を評価する。
計算の概念の例:
- 変数Aが含まれる時の予測精度: 90
- 変数Aが含まれない時の予測精度: 50
- 変数Aの重要度 = 90 - 50 = 40