Ich habe eine Reihe von Standorten in geografischen Koordinaten und möchte die Punkte mithilfe von hierarchischen Clustern und anschließendem Schneiden von Bäumen in verschiedenen "Höhen" gruppieren, um die gruppenweisen Mittelwerte der an jedem Standort aufgezeichneten Variablen zu berechnen.
Ich nehme an, dass eine hierarchische Gruppierung der Entfernungsmatrix geografischer Koordinaten eine irreführende Methode zur Bildung von Gruppen sein kann, da Breiten- und Längengrade nicht gleich weit voneinander entfernt sind.
Ich kann mir dann zwei Wege vorstellen:
- Verwenden der Großkreisentfernung für die Entfernungsmetrik.
- Konvertieren der geografischen Koordinaten in eine gleich skalierte Projektion und anschließendes Ermitteln der euklidischen Entfernung.
Sind diese Ansätze gleichwertig, abgesehen davon, dass Option zwei komplizierter durchzuführen ist? Und was genau bedeutet in diesen Fällen die Schnitthöhe des Baumes?
distance
clustering
digitale Karten
quelle
quelle
Antworten:
Vielen Dank an @whuber, der mich hier auf den richtigen Weg gebracht hat. Es sieht so aus, als ob es keine zusätzlichen Antworten geben wird. Sie werden diese Frage also klären, indem Sie meine eigenen Beobachtungen veröffentlichen, die für andere nützlich sein können, die etwas über Entfernungen, Clustering und Projektionen lernen.
Der folgende Code - R unter Verwendung der
geosphere
,rgdal
undsp
Pakete zeigt , dass eine sorgfältige Auswahl der richtigen Vorsprung kann eine genaue Abstandsmatrix geben (wobei genau wie geodätischen Abstand definiert ist) , wenn Punkte sind bis zu 2000 km voneinander entfernt (Achsen sind in Metern).Diagramme der Elemente dieser drei Distanzmatrizen sind unten gezeigt. Das Diagramm links zeigt an, dass die ausgewählte Projektion in hohem Maße mit der geodätischen Entfernung über den hier verwendeten Entfernungsbereich korreliert. Das richtige Diagramm zeigt zwar den erheblichen Fehler, der zu erwarten wäre, wenn nicht projizierte geografische Koordinaten verwendet würden.
quelle