手元のデータにはマイナスの値がないのに、密度曲線を作成すると、マイナスの値がデータの中にあるように見えることがあります。
これは密度曲線の作られ方に起因しています。
以下のように、各点が1人の従業員の給料を表しているチャートを使って説明します。
密度曲線を描くときには、まず、各点を中心とした正規分布の曲線を描きます。
このとき、描いた正規分布によってはマイナスの値を含むことがあります。
密度曲線は元の値がばらつくことを想定し、その値の周りの値も推測した上で、全ての正規分布を足し上げて描画されるため、手元のデータにマイナスの値がなくても、密度曲線を作成するとマイナスの値があるように見えることになります。