Für jede der 208.781 Census-Blockgruppen möchte ich die FIPS-IDs aller Nachbarn erster Ordnung abrufen. Ich habe alle TIGER-Grenzen heruntergeladen und in einem einzigen 1-GB-Shapefile zusammengeführt.
Ich habe ein ArcPython-Skript ausprobiert, das im Kern SelectLayerByLocation für BOUNDARY_TOUCHES verwendet, aber für jede Blockgruppe, die langsamer ist als gewünscht, dauert es mehr als 1 Sekunde. Dies ist auch dann der Fall, wenn ich die Suche in SelectLayerByLocation auf das Blockieren von Gruppen im selben Status beschränkt habe. Ich habe dieses Skript gefunden , aber es verwendet SelectLayerByLocation auch intern, sodass es nicht schneller ist.
Die Lösung muss nicht auf Arc basieren - ich bin offen für andere Pakete, obwohl ich mit Python am besten programmieren kann.
Antworten:
Wenn Sie Zugriff auf ArcGIS 10.2 for Desktop oder eine frühere Version haben, bietet das Tool " Polygon-Nachbarn (Analyse)" Folgendes:
kann diese Aufgabe jetzt viel einfacher machen.
quelle
Verwenden Sie pysal , um eine Lösung zu finden, die ArcGIS vermeidet . Sie können die Gewichte direkt aus Shapefiles abrufen, indem Sie Folgendes verwenden:
oder
Gehen Sie für die Dokumentation für weitere Informationen.
quelle
Nur ein Update. Nachdem ich Whubers Rat gefolgt war, stellte ich fest, dass die Matrix zum Generieren von Raumgewichten einfach Python-Schleifen und -Wörterbücher verwendet, um Nachbarn zu bestimmen. Ich habe den folgenden Prozess reproduziert.
Der erste Teil durchläuft jeden Scheitelpunkt jeder Blockgruppe. Es erstellt ein Wörterbuch mit Scheitelpunktkoordinaten als Schlüsseln und einer Liste von Blockgruppen-IDs, die einen Scheitelpunkt an dieser Koordinate als Wert haben. Beachten Sie, dass hierfür ein topologisch sauberer Datensatz erforderlich ist, da nur eine perfekte Vertex / Vertex-Überlappung als Nachbarbeziehung registriert wird. Glücklicherweise sind die Shapefiles der TIGER-Blockgruppe des Census Bureau in dieser Hinsicht in Ordnung.
Der zweite Teil durchläuft erneut jeden Scheitelpunkt jeder Blockgruppe. Es erstellt ein Wörterbuch mit Blockgruppen-IDs als Schlüsseln und den Nachbar-IDs dieser Blockgruppe als Werten.
Im Nachhinein stelle ich fest, dass ich für den zweiten Teil eine andere Methode hätte verwenden können, bei der das Shapefile nicht erneut durchlaufen werden musste. Aber dies ist, was ich verwendet habe, und es funktioniert ziemlich gut, auch für Tausende von Blockgruppen gleichzeitig. Ich habe es nicht mit den ganzen USA versucht, aber es kann für einen ganzen Staat durchgeführt werden.
quelle
Eine Alternative könnte die Verwendung von PostgreSQL und PostGIS sein . Ich habe ein paar Fragen zur Durchführung ähnlicher Berechnungen auf dieser Site gestellt:
Ich fand, dass es eine steile Lernkurve gibt, um herauszufinden, wie die verschiedenen Teile der Software zusammenpassen, aber ich fand es wunderbar, um Berechnungen auf großen Vektorebenen durchzuführen. Ich habe einige Berechnungen zum nächsten Nachbarn für Millionen von Polygonen durchgeführt und diese wurden schnell mit ArcGIS verglichen.
quelle
Nur ein paar Kommentare ... Die esri / ArcGIS-Methode verwendet derzeit Wörterbücher, um die Informationen zu speichern, aber die Kernberechnungen werden in C ++ mit dem Polygon Neighbors Tool durchgeführt. Dieses Tool generiert eine Tabelle, die die Informationen zur Kontiguität sowie optionale Attribute wie die Länge der gemeinsam genutzten Grenze enthält. Sie können das Generate Spatial Weights Matrix Tool verwenden, wenn Sie die Informationen immer wieder speichern und anschließend wiederverwenden möchten. Sie können diese Funktion auch in WeightsUtilities verwenden, um ein Wörterbuch [Direktzugriff] mit den folgenden Informationen zu erstellen:
Wenn inputFC eine beliebige Art von Polygon-Feature-Class ist, ist masterField das Feld "eindeutige ID" für Ganzzahlen und contiguityType in {"ROOK", "QUEEN"}.
Es gibt Bestrebungen bei esri, den tabellarischen Aspekt für Python-Benutzer zu überspringen und direkt zu einem Iterator zu wechseln, der viele Anwendungsfälle weitaus schneller machen würde. PySAL und das spdep-Paket in R sind fantastische Alternativen [siehe radeks Antwort] . Ich denke, Sie müssen Shapefiles als Datenformat in diesen Paketen verwenden, das mit dem Eingabeformat dieses Threads übereinstimmt. Nicht sicher, wie sie mit überlappenden Polygonen sowie Polygonen innerhalb von Polygonen umgehen. Durch das Generieren von SWM sowie die von mir beschriebene Funktion werden diese räumlichen Beziehungen als "ROOK" - UND "QUEEN" -Nachbarn gezählt.
quelle