割合の信頼区間が0%以下あるいは100%以上の値を含むのはなぜですか?

エラーバーを使って割合を集計し、信頼区間を確認したときに返品率や離職率など、通常0%以下あるいは100%以上になることはない指標において、割合の信頼区間が0%以下、100%以上の値を含むことがあります。

image

これは、実際にそのようなこと(0%を下回ったり、100%を超えること)がありえなかったとしても、信頼区間はそういった事情を考慮せず、算出されるために起こることです。

信頼区間は平均あるいは割合からの「差」として求められるものになり、上限値は平均や割合に信頼区間を「足したもの」、下限値は平均や割合に信頼区間を「引いたもの」として計算され、上限値と下限値の間の区間がエラーバーなどのチャートで確認できる信頼区間として表現されます。

そのため、0%以下あるいは100%以上の値の範囲を取るケースが出てくことになります。

「いいね!」 2