Kann mir jemand die Faktoren, die den Speicherbedarf von Means-Clustering beeinflussen, mit ein wenig Erklärung erklären?
clustering
k-means
Martin
quelle
quelle
Antworten:
Algorithmen wie Lloyds können nur mit Gleitkommawerten implementiert werden . Der MacQueens k-means-Algorithmus sollte nur Speicher benötigen .k ≤ ( d + 1 )k⋅(2⋅d+1) k⋅(d+1)
Da die meisten Benutzer jedoch wissen möchten, welcher Punkt zu welchem Cluster gehört, verwendet fast jede Implementierung, die Sie finden, -Speicher.O(n+k⋅d)
Mit anderen Worten ist der durch k-Mittel verwendete Speicher im Wesentlichen die Ausgangsdatengröße .
quelle
Ich bin kürzlich auf eine scipy-Implementierung des k-means-Algorithmus in scipy.cluster.vq.py gestoßen
quelle