Geocode-Qualität: Nominatim vs. PostGIS Geocoder vs. Geocoder :: US 2.0

14

Ich muss gelegentlich >> 500.000 US-Adressen geocodieren (keine Merkmale oder Kreuzungen). Ich möchte einen Geocodierungsservice lokal einrichten, um diese Bulk-Geocodes zu verarbeiten.

Ich habe den Tiger-basierten Geocoder :: US 2.0 in der Vergangenheit lokal verwendet. Das anfängliche Benchmarking bietet eine angemessene Genauigkeit gegenüber von Google geocodierten Adressen, insbesondere wenn ich mich nicht auf den Ruby-Parser verlasse und die Adresselemente explizit an den Geocodierer übergebe.

Ich habe auch viel über den PostGIS Geocoder gelesen . Da sich meine Daten bereits in PostGIS befinden, klingt dies attraktiv, aber ich habe sie nicht lokal eingerichtet, um sie auszuprobieren.

Außerdem hat mir jemand empfohlen, Nominatim vor Ort auszuprobieren . Ich weiß nicht viel darüber, außer dass es nicht auf Tiger basiert (soweit ich das beurteilen kann), und ich frage mich, ob ich zuverlässigere Ergebnisse erzielen werde.

Meine Frage an jemanden mit Erfahrung mit den obigen Lösungen: Wie ist die Genauigkeit der drei zu vergleichen? Welche Geocodes bieten konkret die beständigste Zuverlässigkeit für US-Straßenadressen? Ich bin nicht übermäßig mit Geschwindigkeit oder Komplexität beschäftigt.

Danpelota
quelle

Antworten:

14

Ich hatte keine Gelegenheit, die Geocoder von Nominatim und Geocoder US zu testen. Mein Verständnis ist jedoch, dass der Geocoder und Nominatim nicht direkt in der Datenbank ausgeführt werden können, was für mich ein großer Nachteil ist, da es schwierig ist, sie in Dingen wie Triggern oder für Stapelaktualisierungen direkt in der Datenbank zu verwenden.

Der PostGIS-Geocoder ist ein reiner PostGIS / postgresql-Satz von plpgsql-Funktionen und wird vollständig in der Datenbank ausgeführt. Ich würde erwarten, dass die Geocoder US- und PostGIS-Geocoder-Ergebnisse gleichwertig sind und von dem, was ich mit dem Webmaterial getestet habe, sind sie. Google ist ein bisschen besser, da sie Ortsnamen ausnutzen.

Ich denke, dass Nominatum, da es OSM-Daten verwendet, Tigerdaten indirekt verwendet, da OSM-Importe für die USA einen Großteil davon von TIGER mit Korrekturen durch den Benutzer stammen. Ich bin nicht sicher, welcher Jahrgang von Tiger OSM gerade läuft. Beim Online-Spielen mit den Web-Interfaces werden auch Ortsnamen genutzt. Interessanterweise können Sie hiermit die Zoomstufe der Geokodierung festlegen, die eine schnellere Geokodierung ermöglicht, indem Sie die gewünschte Zoomgenauigkeit festlegen.

Vollständige Offenlegung - Ich habe viel an PostGIS Geocoder gearbeitet und das Online-Handbuch dafür geschrieben. Ich werde Ihnen sagen, dass der Fehler, an dem ich arbeite, meiner Meinung nach auf der falschen Straßenseite liegt. Ich arbeite daran, das zu beheben. Wenn es Sie weniger interessieren könnte, auf welcher Straßenseite (oder zumindest manchmal), ist dies für Sie möglicherweise kein Problem.

Es lohnt sich wahrscheinlich, mit den Online-Versionen zu testen, die einige Adressergebnisse vergleichen: z. B. nominatim können Sie hier testen: http://open.mapquestapi.com/nominatim/v1/search.php

Für meine Anwendungsfälle habe ich festgestellt, dass die Fuzzy-Prüfung von Nominatum nicht so gut ist wie die von PostGIS Geocoder. Zum Beispiel ist meine Vanity Street-Adresse (Postanschrift) 1 Devonshire Place, Boston, MA. PostGIS gibt eine Antwort zurück, die, wie ich mich erinnere, sehr ähnlich ist. Google gibt eine Antwort zurück, aber ich kann Nominatim nicht dazu bringen, eine Antwort zurückzugeben. Um fair zu sein, auch Boston Paketaufzeichnungen haben keine Ahnung, wo dies ist und wird in Paketaufzeichnungen als Washington Street aufgeführt. PostGIS kann es finden, da es verschiedene Ebenen der Überprüfung und Kreuzung von Querstraßen usw. durchführt. Ich habe andere Fälle getestet, in denen ich absichtlich die Postleitzahl falsch eingetippt habe oder so, und PostGIS kommt mit einem genauen Satz von Optionen zurück. Google auch.

LR1234567
quelle
Additonal Kommentar: Wahrscheinlich lohnt sich , mit den Online - Versionen zu testen einige Adress Ergebnisse zu vergleichen: zB nominatim können Sie hier testen: open.mapquestapi.com/nominatim/v1/search.php
LR1234567
Danke für die Antwort! Ich werde in der nächsten Woche ein Benchmarking durchführen, aber ich war bisher vom PostGIS Tiger-Codierer beeindruckt.
Danpelota
Natürlich mit Ausnahme des gelegentlichen Auflegens für einen Neuling: postgis.refractions.net/pipermail/postgis-users/2011-March/…
danpelota
tigergeocoder.com verwendet TIGER 2013-Daten und ist bereit, Ihre eigene Serverinstanz in der Amazon EC2-Cloud und mit einer Geocodierung von über 1.000.000 pro Tag auszuführen. Wie Sie bereits erwähnt haben, hat PostGIS auch Zillow Neighborhoods geladen und gibt FIPS-Codes für die Adressteile zurück. REST-API ähnlich wie Google, jedoch eigener Server, keine Quote erforderlich.
Biba
Nominatim läuft schnell und ist in der Regel im Jahr 2019 genauer. Es werden keine Bereiche geschätzt und die Adressermittlung ist einfach besser.
Andrew Scott Evans
-1

Technisch gesehen können Sie Tiger- und OSM-Datenbanken auf einem riesigen Server stapeln und in Nominatum OSM erstellen. Tiger kann einfach importiert werden und ergänzt den OSM-Server.

Wer auch immer, die Qualität der Daten, die Sie zurückerhalten, wird nicht auf dem Dach liegen. Dem OSM mangelt es an Genauigkeit für Straßenadressen in den USA. In einigen Fällen habe ich es bis zu 90 Meilen vom ursprünglichen Ziel entfernt gesehen.

Die Tiger-Datenbank ist auch aufgrund des ihr zugewiesenen Interpolationsalgorithmus zur Vorhersage von Straßennummernpositionen nicht genau. Im Allgemeinen werden sie das tatsächliche Ziel von 300 Fuß auf einige Meilen verschieben.

Ich denke, Sie müssen Zeit und Hosting-Ressourcen abwägen, wenn Sie einen eigenen Geocoder erstellen, anstatt einen kommerziellen zu verwenden. Mit dem kommerziellen werden Sie Dachstandorte bekommen und sich um nichts kümmern. Die Preise für 500.000 US-Dollar liegen zwischen 600 und 800 US-Dollar bei verschiedenen Anbietern.

ivan
quelle
2
Was hat Ihre Antwort mit Ihrem Unternehmen zu tun? Anscheinend fügen Sie eine Signatur mit einem Link zu Ihrer Website hinzu, in diesem Fall als unnötiger Haftungsausschluss, und ich bearbeite sie gerade. Bitte fügen Sie in keinem Fall einen Link in den Haftungsausschluss ein.
PolyGeo