Exploratory コミュニティ

密度曲線でマイナスの値が表示されるのはなぜですか

#1

手元のデータにはマイナスの値がないのに、密度曲線を作成すると、マイナスの値がデータの中にあるように見えることがあります。

image

これは密度曲線の作られ方に起因しています。

以下のように、各点が1人の従業員の給料を表しているチャートを使って説明します。

image

密度曲線を描くときには、まず、各点を中心とした正規分布の曲線を描きます。

image

このとき、描いた正規分布によってはマイナスの値を含むことがあります。

image

密度曲線は元の値がばらつくことを想定し、その値の周りの値も推測した上で、全ての正規分布を足し上げて描画されるため、手元のデータにマイナスの値がなくても、密度曲線を作成するとマイナスの値があるように見えることになります。

image

5 Likes