Als «clustering» getaggte Fragen

12
Clustering räumlicher Daten in R

Ich habe eine Reihe von monatlichen SST-Daten (Sea Surface Temperature) und möchte eine Cluster-Methode anwenden, um Regionen mit ähnlichen SST-Mustern zu erkennen. Ich habe eine Reihe von monatlichen Datendateien, die von 1985 bis 2009 laufen, und möchte als ersten Schritt das Clustering auf jeden...

12
Wie führt man eine Imputation von Werten in einer sehr großen Anzahl von Datenpunkten durch?

Ich habe einen sehr großen Datensatz und es fehlen ungefähr 5% zufällige Werte. Diese Variablen sind miteinander korreliert. Der folgende Beispiel-R-Datensatz ist nur ein Spielzeugbeispiel mit Dummy-korrelierten Daten. set.seed(123) # matrix of X variable xmat <- matrix(sample(-1:1, 2000000,...

12
k-bedeutet || aka Scalable K-Means ++

Bahman Bahmani et al. Einführung von k-means ||, einer schnelleren Version von k-means ++. Dieser Algorithmus stammt von Seite 4 ihrer Veröffentlichung Bahmani, B., Moseley, B., Vattani, A., Kumar, R. und Vassilvitskii, S. (2012). Skalierbares k-means ++. Verfahren der VLDB-Stiftung , 5 (7),...