Kennen Sie gute Ressourcen zu Geokodierungsalgorithmen?
Ich interessiere mich insbesondere für das Parsen von Adressabfragen, einschließlich des Abgleichs und der Gewichtung von Abfrageteilen, für Rechtschreibfehler und Variationen sowie für Details zur physischen Datenspeicherung (z. B. Schemata für direkte relationale Datenbankabfragen, Ansätze zur Datenindizierung usw.). .
Ich habe einige Dokumente zur ArcGIS 10-Geokodierung studiert, aber sie berühren die tatsächlichen Implementierungsdetails nur ein wenig. Eine detaillierte Dokumentation anderer hochwertiger Produktionsimplementierungen könnte ebenfalls hilfreich sein. Je technischer desto besser. Theoretische Algorithmuspapiere sind auch großartig.
Vielen Dank.
Das mit Mapperz verknüpfte Papier ist sehr gut und enthält viele Zitate, die wahrscheinlich von Interesse sein werden, aber ich denke nicht, dass sie die Zeichenfolgenübereinstimmung und ihre Bedeutung für den Geokodierungsprozess sehr gut beschreiben. Sie haben Soundex kurz erwähnt , aber Soundex ist nicht die einzige Option und auch nicht die beste Option für Adressen IMO. Sie haben eine ganze Reihe von Zitaten aufgelistet, die für das Thema relevant sind, daher sind diese Artikel für Sie von Interesse.
In diesem Thread auf der Statistik-Austauschwebsite wird über das Fuzzy-Matching von zwei Zeichenfolgensätzen gesprochen, und beim Matching von Adressen werden dieselben Techniken angewendet. Insbesondere die Verwendung von Bearbeitungsabständen ist meiner Meinung nach sinnvoller als Soundex, insbesondere bei Adressangaben, die kein Soundex-Analog haben. Die Berechnung des Levenshtein-Abstands zwischen zwei Zeichenfolgen ist nicht allzu kompliziert, und es gibt viele Beispiele, die im Internet schweben ( hier eines in Python).
Ich habe gerade die letzte Stunde damit verbracht herauszufinden, wie ESRI ihre Rechtschreibempfindlichkeit und ihre unterschiedlichen Kandidaten- und Match-Scores implementiert. Ich habe nur einfache Beschreibungen gefunden (die besten, die ich in der Online-Hilfe zu diesem PDF und 9.3 gefunden habe ). Wenn mich jemand auf detailliertere Unterlagen hinweisen kann, wäre ich ebenso dankbar wie das OP.
quelle
Die Universität von South Carolina verfügt über Adressverarbeitungs- und Geokodierungsdienste , für die sie einige technische Details veröffentlicht haben. Sie haben viele gute Referenzen auf ihrer Website.
quelle
Die von UK JISC bereitgestellte GEOREFERENCING-Mailingliste https://www.jiscmail.ac.uk/cgi-bin/webadmin?A0=GEOREFERENCING
Mein Blog (Abschnitt Geokodierung) enthält den gelegentlichen Beitrag zur Geokodierung und zur Auflösung von Toponymen (sein unstrukturierter Cousin): http://bit.ly/lQ0Sjs
quelle
Eine gute Ressource für die Geokodierung von Studien https://webgis.usc.edu/Services/Geocode/About/TechnicalDetails.aspx
quelle