Exploratory コミュニティ

マーケット・バスケット分析アナリティクスビューの設定項目の解説

#1

マーケット・バスケット分析アナリティクスビューの設定項目について、質問を受けましたので、こちらでいくつかの設定項目を詳しく説明させていただきます。

アイテム数の最小値 (Minimum Item Length)

アイテム数の最大値 (Maximum Item Length)

マーケットバスケット分析が探してくるルールは、「アイテムA, B, Cを買う人は、一緒にアイテムXも買っている」といった形式のものです。

ここで言う「アイテム数」はこのルールだとA, B, Cの3つということになります。

例えばこの値を、最小2,最大3とすると、

「アイテムA, Bを買う人は、一緒にアイテムXも買っている」(アイテム数2のルール)
「アイテムA, B, Cを買う人は、一緒にアイテムXも買っている」(アイテム数3のルール)

といったルールは探す対象に入るのに対して、

「アイテムAを買う人は、一緒にアイテムXも買っている」(アイテム数1のルール)
「アイテムA, B, C, Dを買う人は、一緒にアイテムXも買っている」(アイテム数4のルール)

といったルールは、探す対象に入れない、ということになります。

バスケット内のアイテム数の最大値 (Maximum Number of Items in a Basket)

こちらは、計算時間短縮のための前処理に関する設定です。

マーケットバスケット分析の入力データは、一回の買い物(バスケット)にどんなアイテムが入っていたか、を多数集めてきたものですが、ここでアイテムの数が多いバスケットが多いと、計算負荷が高くなってきます。

そのため、こちらの前処理で、一つのバスケットに入れることができる最大のアイテム数を定めることができます。

バスケットの中に入っている、同じアイテムの数を基準に、少ない個数しか買っていないアイテムは、そのバスケットに入っていなかったことにして問題を単純化する代りに計算時間の短縮をねらいます。

参考:マーケット・バスケット分析アナリティクスビューのドキュメント

1 Like