チャートやアナリティクスで表示されている「サンプルサイズ」とは何を表しているのでしょうか?

一部のアナリティクスやチャートでは、計算処理や描画速度を早めるためにデータをランダムでサンプルしてから表示しています。

下記はアナリティクスビューにあるロジスティック回帰の例ではありますが、51,290行あるうちの50,000行(デフォルト)をサンプルしていることになります。

image

もしデータをサンプルせずに実行したい場合は、サンプルサイズのチェックを外すことで可能です。

image

一方で、データが100万行などの非常に多いデータ量であれば実行するのに時間がかかってしまうため、データはサンプルしたいが、デフォルトの50,000行よりは増やし(減らし)たい場合は、サンプルサイズにチェックをつけた状態で任意の行数を指定することで可能です。

image

上記はアナリティクスの例でしたが、散布図などの一部のチャートでもデータをサンプルして表示しています。

image

もしデータのサンプルする行数を増やしたい場合は、プロパティにある「サンプルサイズ」から変更が可能です。

image

サンプルサイズを変更したことにより、散布図で使用するデータの行数が変化していることが確認できます。

image

「いいね!」 3