相関モードの相関係数とR2乗はどちらを使ってソートすれば良いですか?

質問

相関モードで列に数値を割り当てた際に、ソートには相関係数とR2乗のどちらを使用すればいいのでしょうか?

回答

相関係数でソートする場合は、相関係数がプラスからマイナス方向に列が並び替えられ、カテゴリーの場合は相関係数はないので後ろの列にまとまってしまいます。

image

しかし、R2乗では相関係数の2乗の値になるので、相関のプラス、マイナスを気にせずに使用できます。

また、R2乗はカテゴリー型の列でも計算されるので、相関にしている列を除く、全ての列における相関が高い順に並び替えることができます。

image

そのため、「どの変数が目的としている列にもっとも相関があるか」を知りたいのであればR2乗を使用いただくことをおすすめしています。

「いいね!」 3