Ich habe eine Reihe von monatlichen SST-Daten (Sea Surface Temperature) und möchte eine Cluster-Methode anwenden, um Regionen mit ähnlichen SST-Mustern zu erkennen. Ich habe eine Reihe von monatlichen Datendateien, die von 1985 bis 2009 laufen, und möchte als ersten Schritt das Clustering auf jeden Monat anwenden.
Jede Datei enthält Rasterdaten für 358416 Punkte, bei denen ungefähr 50% Land sind und mit einem 99,99-Wert markiert sind, der NA ist. Das Datenformat ist:
lon lat sst
-10.042 44.979 12.38
-9.998 44.979 12.69
-9.954 44.979 12.90
-9.910 44.979 12.90
-9.866 44.979 12.54
-9.822 44.979 12.37
-9.778 44.979 12.37
-9.734 44.979 12.51
-9.690 44.979 12.39
-9.646 44.979 12.36
Ich habe die CLARA-Clustermethode ausprobiert und einige anscheinend schöne Ergebnisse erzielt, aber es scheint mir auch, dass es sich nur um das Glätten (Gruppieren) von Isolinien handelt. Dann bin ich mir nicht sicher, ob dies die beste Clustermethode für die Analyse von Geodaten ist.
Gibt es eine andere Clustering-Methode für diese Art von Datensätzen? Ein Hinweis wäre gut, um mit dem Lesen zu beginnen.
Danke im Voraus.
quelle
Antworten:
Es gibt verschiedene Ansätze für skalierbares Clustering, Divide- und Conquer-Ansätze, paralleles Clustering und inkrementelles Clustering. Dies ist eine allgemeine Vorgehensweise, nachdem Sie normale Clustering-Methoden verwenden können. Ich schätze, dass DBSCAN (Density-Based Spatial Clustering von Anwendungen mit Rauschen) eine gute Clustering-Methode ist. Es ist einer der am häufigsten verwendeten Clustering-Algorithmen.
quelle
Eine gut dokumentierte Python-Bibliothek für räumliche Analysen mit einigen Clustern ist pySAL .
Eine weitere Python-Bibliothek in der Entwicklungsphase, die sich auf räumliches Clustering konzentriert, ist clusterPy (pdf-Präsentation) .
Mit einer begrenzten Auswahl an Clustering-Algorithmen, aber mit einer schönen Mapping-Oberfläche ist die GUI-Software GeoGrouper .
quelle