時系列クラスタリングを実行する際に、欠損値の割合が多いグループは取り除く必要がありますか?

時系列クラスタリングにて、特定のグループで欠損値が多い場合は除いた方が結果がわかりやすいことがあります。

そこで、グループごとに欠損値の割合を計算して、欠損値の割合が多いものは除くことができます。

プロパティにある「欠損値の割合がこの値以上」を設定することで可能です。

image

デフォルトでは0.5が指定されており、欠損値が50%以上あるグループを取り除くことになります。

例えば、0.9と指定すると欠損値が90%以上のグループを取り除くことになるので、反対に欠損値が90%よりも下のものでも含めて実行できるということになります。

「データの確認タブ」からグループごとにデータが欠損していないかを確認できます。

image

「いいね!」 3