列の値どうしの相関を分析したい

例えば、注文データがあり、顧客ごとにどの製品カテゴリーを一緒に買っているのか、つまり列の値どうしの相関を知りたいとします。

スクリーンショット 2022-08-30 10.41.28

このデータは1行が1明細のデータになっていますが、相関を見るためには1行1顧客にして、それぞれの製品カテゴリーごとに列を持ったデータにしたいです。

顧客名の列ヘッダメニューから「ピボット」を選択します。

image

行に「顧客名」を列に「製品カテゴリー」を割り当て、値には「行の数」を選択します。

image

また、顧客によっては購買していない製品カテゴリーもあるため、その場合は値が欠損値になってしまうため、デフォルト値には「0」と指定します。

image

1行1顧客で、製品カテゴリーごとに列を持ったデータにすることができました。

image

アナリティクスビューに移り、タイプに「相関」を選び、変数を選択します。

この際に、アナリティクスのピンがピボットのステップに紐づいていることを確認してください。

image

変数に先程の列に展開した製品カテゴリーの値の列を選択します。

image

実行することで、製品カテゴリーの値ごとの相関を確認することができました。

image

上記は、アナリティクスビューで列の値どうしの相関を分析するための方法でしたが、データラングリングのステップとして実行することも可能です。

製品カテゴリーの列ヘッダメニューから「アナリティクス」の「相関」を選択します。

image

相関を計算のダイアログが表示されるため、列には「製品カテゴリー」を、次元には「顧客名」を、値には「Number of Rows(行の数)」を選択して実行します。

image

次元には、アナリティクスビューで相関を実行する時の準備としてあったピボットのように、どの単位で相関を見たいかを指定することとなります。今回の場合は、顧客ごとに見たかったため、次元には「顧客名」を指定しています。

実行することで、、製品カテゴリーの値ごとの相関を計算することができました。

image

「いいね!」 1