例えば、1000行あるデータでランダムフォレストのモデルを作成したとします。
プロパティからテストモードをTRUEにして、テストデータに対しての予測モデルの精度を確認します。
すると、行の数がトレーニングデータで536行、テストデータで229行と合計で765行となっていることがわかります。1000行あったデータですが、モデルに使用されている行数が少なくなっています。
行数が減ってしまう理由としては、予測変数に使用されている列に欠損値がある場合は、欠損値がある行を取り除かれてモデルが作成されるからです。
今回の例では、対象の列に欠損値の数が235行あったため、1000行 - 235行
をした765行がランダムフォレストのテストモードのモデルに使用されていました。