Unter welchen Bedingungen ist K-bedeutet Clustering transformationsinvariant?

Bei einer Menge von Datenpunkten $X = \{x_1, x_2, \ldots, x_m\}$ wobei $x_i \in \mathbb{R}^d$ wir K-Mittel auf $X$ und erhalten die Cluster $c_1, c_2, \ldots, c_k$ .

Wenn wir nun einen neuen Datensatz wobei und und K-means auf ausführen , um die Cluster . $Y = \{y_1, y_2, \ldots, y_m\}$ $y_i = Ax_i + b$ $y_i \in \mathbb{R}^d$ $Y$ $g_1, g_2, \ldots g_k$

Unter welchen Bedingungen von und erhalten wir garantiert die gleichen Cluster? $A$ $b$

Nehmen wir an, dass K-means den euklidischen Abstand verwendet und für beide Algorithmen die gleichen Anfangsbedingungen hat wenn die Anfangszentren für X dann sind die Anfangszentren für Y wobei . $c^0_1, \ldots, c^0_k$ $g^0_1, \ldots, g^0_k$ $g^0_i = Ac^0_i + b$

Bisher habe ich gedacht, dass den vollen Rang haben muss und ein beliebiger Vektor sein kann. Ich konnte es jedoch nicht beweisen. $A$ $b$

algorithms clustering Ana Echavarria
quelle

Antworten:

Die Antwort hängt von Ihrem K-Means-Algorithmus ab, aber was folgt, sollte für Standardalgorithmen funktionieren.

Sie erhalten das gleiche Ergebnis, wenn Ihre Transformation zwei Bedingungen erfüllt: $T$

Es werden Abstände beibehalten: , wobei Ihre Metrik ist, sagen wir. $d(z,w) = d(T(z),T(w))$ $d$ $d(z,w) = \|z-w\|$
Es werden Durchschnittswerte beibehalten: Wenn eine konvexe Kombination ist, ist . $\sum_i p_i z_i$ $T(\sum_i p_i z_i) = \sum_i p_i T(z_i)$

Sie können dies überprüfen, indem Sie den Algorithmus durchgehen und zeigen, dass er immer die gleichen Entscheidungen trifft.

Yuval Filmus
quelle

Danke Yuval, das macht sehr viel Sinn. Würde dies dann bedeuten, dass A für den euklidischen Abstand eine orthogonale Matrix sein müsste, um eine starre Transformation zu erzeugen?

Ana Echavarria

Es scheint so.

Yuval Filmus