散布図の「集計あり」と「集計なし」での相関を調べる際の違いについて

散布図の「集計あり」と「なし」での使い分けですが、相関係数を出して調べる場合は散布図の集計なしの方が適していることが多いかと思います。

というのも、元のデータが1行1観察対象(例:顧客、など)の場合は、そのままのデータで可視化をしたいので、元のデータで可視化ができる散布図集計なしの方が相関係数の値も正しいものだと言えます。

一方で、散布図「集計あり」を使ってしまうと、カテゴリー別(例:国など)に集計をしたデータに対して相関係数を出すことになるので、その結果は正しい結果だと言えないことがあります。

そのため、データがどういう単位か、最終的にどの単位で相関を見たいかによっても、散布図の集計あり、なしのどちらが適しているかは変わってきます。

ただ、上述したように一般的には散布図集計なしを使って相関係数を見ていくことの方が多いかと思います。

散布図の集計あり、なしの違いについては下記の資料でも紹介しておりますので、ご参照ください。

「いいね!」 3