数値を「等頻度」でカテゴリー化する時にエラーが発生する

例えば、「数量」のように数値型の列をカテゴリーを作成の機能を使って「等頻度」に分けようとした時に、下記のようなエラーが発生することがあります。

image

この問題については、等頻度でカテゴリーを作る時に、一意な値の数が足りない時に発生します。

理由としては、等頻度ではそれぞれのカテゴリーに含まれる行数を一定にするように数値の幅を決めてカテゴリー分けしていきますが、下記のように一部の値にデータが偏っているとカテゴリーを10個に分けるほどの一意な値の数が存在しないためです。

ちなみに、整数値で値の範囲が小さい時にこの問題が発生しやすいです。

回避策としては、カテゴリーの数を10から減らしてみていただくと等頻度でカテゴリー分けできるかもしれません。

上記のチャートであれば、等頻度でカテゴリー数を4にすると分けられるようになりますが、整数値で値の範囲が小さい時には、行の数が一定にならないことがあります。

カテゴリーを作成のステップでも「等頻度」で分類する数を「4」に指定することで、エラーなく実行できていることがわかります。

image