ロジスティック回帰分析のためのサンプルサイズの求め方について質問です。
「説明変数の数×10で必要なサンプルサイズが求まる」
という記事、論文を見つけたのですが本当にそれほどシンプルな解釈で大丈夫でしょうか?
https://www.jclinepi.com/article/S0895-4356(96)00236-3/pdf
※サポートへのお客様からの質問を、個別の事情を伏せた上で共有させて頂いたものです。
ロジスティック回帰分析のためのサンプルサイズの求め方について質問です。
「説明変数の数×10で必要なサンプルサイズが求まる」
という記事、論文を見つけたのですが本当にそれほどシンプルな解釈で大丈夫でしょうか?
https://www.jclinepi.com/article/S0895-4356(96)00236-3/pdf
※サポートへのお客様からの質問を、個別の事情を伏せた上で共有させて頂いたものです。
一つ注意が必要だと思うのは、予測変数の数x10は、データの行数ではなくイベントの数だという点です。
例えばABテストのような、異なる条件に対してコンバージョンするかどうかを見る分析であれば、これはコンバージョンのあったデータの数ということになります。
つまり予測変数の数x10だけのコンバージョンのあった場合のデータの数に加えて、それに伴うコンバージョンの無かった場合のデータの数も足したものが必要な全サンプル数ということになります。