K-Meansクラスタリングの設定に表示される「反復回数」や「試行回数」は何を表していますか?

K-Means クラスタリングでは最初にランダムにクラスターの中心点の位置を決め、観察対象をクラスターに分けることになります。

Exploratoryではシードがセットされているため、同じマシンで実行している限りは結果が変わることはありませんが、最初に決められたクラスターの中心点が変わることによって結果が変わってしまうことがあります。

そこで試行回数ではK-Meansクラスタリングがグループ分けをする処理を試行する回数、言い換えれば、クラスターの中心点の位置を決め、観察対象をクラスターに分ける処理を繰り返す回数を決めて、より安定した結果を得られるようになっています。

image

なお、反復回数は1回の試行の中で、クラスターに分けるための処理の実行回数を表しています。

image