エンゲージメントサーベイのデータを使い、各設問がエンゲージメントスコアに与える影響を予測モデルを使って調べようと思っています。テストデータとトレーニングデータに分割すべきでしょうか。

エンゲージメントスコアに対する要因分析を実施することが目的の場合、データを分割して予測精度を検証する必要は必ずしもありません。

一方で、構築した予測モデルを使って未知のデータに対して予測を行いたい場合、未知のデータに対する予測精度が重要になるため、テストモードでデータをテストデータとトレーニングデータに分けて未知のデータに対する精度を確認するべきであることをお伝しています。

なおモデルの予測精度の検証方法の詳細は以下のリンクをご参考ください。