Wie vergleiche ich zwei Karten, um festzustellen, welche besser ist?

10

Ich versuche, zwei verschiedene Karten für dieselbe Region objektiv zu vergleichen. Im Moment habe ich Probleme damit, Kriterien zu definieren, die es mir ermöglichen, eine leidenschaftslose Bewertung vorzunehmen.

Hat jemand Ideen, wie das geht oder wie ich das Problem angehen soll?

Wie Sie sehen können, ist keine Karte überlegen, ein paar Lücken im blauen Satz, einige im roten.

Geben Sie hier die Bildbeschreibung ein

Styp
quelle
7
Die Frage ist sehr schlecht definiert? Was meinst du mit Qualität? Gibt es Vermutungen über Vollständigkeit, Genauigkeit, Geometrie ...? Gibt es einen dritten Referenzdatensatz, mit dem verglichen werden kann?
Petzlux
Nur ein Gedanke, warum vergleichen Sie sie nicht mit hochauflösenden Luftbildern? Vielleicht konvertieren Sie sie sogar in KML und bewerten ihre Genauigkeit in Google Earth.
Aaron
2
@Martin, fragen Sie nach einer Methode, um die geometrischen Unterschiede der beiden Ebenen hervorzuheben?
Artwork21
1
Es gibt viel Literatur zu diesem Thema. Einige Papiere, um Ihnen den Einstieg
underdark
1
Hat diese Frage nicht wirklich wenig mit Kartografie oder Karten zu tun, sondern eher mit Datenqualität? Vielleicht könnten Sie Ihre Frage umformulieren und mehr Kontext auf der Seite der Datenqualität bereitstellen.
blah238

Antworten:

14

Diese Antwort beschreibt eine objektive Methode zur Messung beliebiger Diskrepanzen zwischen zwei räumlichen Datensätzen. Solche Abweichungen können Positionsverschiebungen, Formänderungen und Merkmale umfassen, die in einem Datensatz vorhanden sind, in einem anderen jedoch nicht. Diese Antwort ist nicht bietet keine Mittel , um zu bestimmen , welche ist „besser“ , weil das auf viel mehr hängt als nur die Daten und es hängt vor allem ab , was die Daten für verwendet werden.

Hintergrund

Eine gute Grundlage für eine große Anzahl solcher Messungen ist die euklidische Abstandstransformation jedes Datensatzes. Dadurch wird jeder Datensatz als eine Sammlung von Punkten in der Ebene dargestellt. Nennen wir diese Sammlungen B für die blauen Merkmale und R für die roten Merkmale.

Für einen beliebigen Punkt x in der Ebene, Transformation der euklidische Abstand eines Punktes Satz A die größte untere der Abstände zwischen gebundenen berechnet x und A . Wir können uns diese Transformation als eine "Oberfläche" vorstellen, deren Höhe bei x dem kürzesten Abstand von x zu A entspricht . Somit hat diese Oberfläche Täler an allen Punkten von A , wo ihre Höhe Null ist, und steigt mit einer Neigung von 1: 1 von A weg an . Es ist klar, dass die Entfernungstransformation wiederum A bestimmt (oder technisch den metrischen Abschluss , der für GIS-Datensätze mit A identisch ist) als Menge aller Punkte in einer Höhe von Null. Somit erfasst die Entfernungstransformation vollständig alle räumlichen Informationen von A , die das GIS darstellen kann.

Abbildung 1

Diese Abbildung zeigt die Abstandstransformationen von B (links) und R (rechts) im Pseudorelief.

Vergleich zweier Datensätze

Um B und R zu vergleichen , überlagern Sie sie jeweils mit der Abstandstransformation des anderen:

Figur 2

Die Abstandswerte werden als Farben angezeigt, die von Blau (nahe 0) bis Rot reichen.

Die linke Karte, zum Beispiel, zeigt die Punkte von B und Farben , um sie entsprechend ihre Abstände von R . Die Rollen von B und R werden in der rechten Karte vertauscht.

Bereits diese helfen dem Auge bei Vergleichen: Jede Karte zeigt die Punkte eines Datensatzes und hebt durch die Verwendung von Farbe die Punkte hervor, die weit von einem Punkt im anderen Datensatz entfernt sind. Beachten Sie, dass beide Karten für den Vergleich benötigt werden, da jede Punkte nicht auf der anderen zeigt.

Auf detaillierten Karten kann es schwierig sein, die Farbe zu erkennen. Daher können wir sie zur Präsentation oder visuellen Auswertung ein wenig verwischen:

Figur 3

NB: Die Farben sind zwischen den beiden Karten nicht vergleichbar: Innerhalb jeder Karte werden sie skaliert, um den gesamten Entfernungsbereich in dieser Karte anzuzeigen.

Statistische Analyse der Unterschiede

Das Schöne an diesem Ansatz liegt darin, was in der Nachbearbeitung getan werden kann. Mithilfe eines Rasters zur Darstellung der Entfernungstransformationen und ihrer Überlagerungen können wir leicht lokale und globale Statistiken erhalten, um die Diskrepanzen zu messen. Zum Beispiel könnten wir uns auf alle Entfernungen konzentrieren, die größer als ein kleiner Schwellenwert sind, und ihre Häufigkeitsverteilung untersuchen:

Figur 4

In diesem Histogramm stehen blaue Balken für die blauen Merkmale und rote Balken für die roten Merkmale. (Beachten Sie die logarithmische Skala auf der horizontalen Achse.) Dieses Histogramm zeigt die ursprünglichen überlagerten Daten, nicht die abgeleiteten unscharfen Daten. Es wurden nur die Abstände ausgewählt, die im Originalbild größer als drei Pixel sind.

Diese Histogramme zeigen, dass blaue Merkmale viel häufiger weit von roten Merkmalen entfernt sind als umgekehrt : Die blauen Balken sind höher als die roten und erstrecken sich über größere Entfernungen (rechts). Das gesamte Arsenal deskriptiver Statistiken steht jetzt zur Quantifizierung der Unterschiede zwischen den beiden Datensätzen zur Verfügung. Diese Statistiken können auf die gesamte Region von Interesse angewendet oder darüber "gefenstert" werden, um zu untersuchen, wie sich die beiden Datensätze je nach Standort unterscheiden.

Implementierung

Die meisten Raster GISes bietet eine euklidische Distanz (wie Transformation Euklidischer Abstand in ArcGIS und r.grow.distance in GRAS) und alle Unterstützung des einfachen (Maskierung) Overlay erforderlich , um diese Analyse zu tun. Falls gewünscht, kann die Unschärfe mit einem Nachbarschaftsmittelwert oder einer Kernelfaltung erfolgen (einschließlich der "Gaußschen Unschärfe", die in allen Bildverarbeitungsprogrammen verfügbar ist). Die meisten GIS bieten keine ausreichende Unterstützung für die vollständige statistische Analyse von Rasterdaten, aber sie können solche Daten gut in Formaten exportieren, die von statistischer und mathematischer Software wie Roder Mathematica (die alle Zahlen hier erstellt hat) lesbar sind .

whuber
quelle
Wie immer ist Ihre Antwort eine faszinierende Lektüre, und ich finde neue Dinge zum Lernen und Nachdenken. Können Sie mir auch sagen, wie Sie den handgezeichneten Diagrammtyp erstellt haben?
Devdatta Tengshe
3
@ Devdatta Das Histogramm wurde in Mathematica durch Nachbearbeitung mit einer Änderung des Codes unter mathematica.stackexchange.com/questions/11350/xkcd-style-graphs erstellt . Weitere Beispiele für solche Grafiken finden Sie unter stats.stackexchange.com/questions/49123/… und stats.stackexchange.com/questions/48973/… und stats.stackexchange.com/questions/48467/… .
whuber
4

Laden Sie aktuelle Bilder und prüfen Sie, ob Sie die Straßen als vorhanden oder als vorhanden validieren können, da es sich anscheinend um ein Geometrieüberprüfungsproblem handelt. Wahrscheinlich ist ein Datensatz neuer und / oder vollständiger. Finden Sie heraus, welcher Datensatz die größte horizontale Genauigkeit aufweist und welcher zuletzt und nach welchem ​​Verfahren erfasst wurde. Ist es ein Unterschied zwischen Tiger-, Osm-, GIS- und GPS-Spuren? Bilder sind dein Freund hier, zumindest genaue Bilder wie HAIP des letzten Jahrgangs. Das Kriterium könnte Vollständigkeit, Abdeckung, Genauigkeit, Richtigkeit und Währung sein.

Lewis
quelle
1

Ich denke, ich folge den obigen Kommentaren und Antworten (vielleicht sollte dies auch eher ein Kommentar als eine Antwort sein), aber ich würde jedes verfügbare Mapping verwenden, um die Dateien durch visuellen Vergleich zu validieren. Wählen Sie Funktionen aus, für die genaue geplottete Daten verfügbar sind, z. B. Straßennetze (in England sind Schottland und Wales bei OS frei verfügbar).

In Anlehnung an den Vorschlag, Google Earth und Bilder zu verwenden. Verwenden Sie das Openlayers-Plugin, um Satellitenbilder in den Hintergrund zu laden und erneut zu vergleichen.

Viele kostenlose, genaue Karten, die als Vergleichsbasis dienen.

Ger
quelle
Leider habe ich diesen Vergleich aufgrund der Tatsache durchgeführt, dass OSM und andere OpenSource-Karten wirklich nicht so genau sind, wie wir zu denken scheinen. Die Eingabe zur Verwendung von Satellitenbildern ist jedoch ein Hinweis, dem Sie folgen müssen!
Styp