Berechnung der räumlichen Korrelation zwischen Merkmalen aus zwei separaten Ebenen in QGIS

10

Ich versuche festzustellen, ob die Anwesenheit einer großen Anzahl von aktiven Militärtruppen in einem Gebiet räumlich mit einem höheren / niedrigeren Ausmaß an Gewaltverbrechen korreliert. Das heißt, sind die Gebiete um große Militärbasen im Durchschnitt mehr oder weniger gewalttätig als Gebiete, die sich nicht in der Nähe von Militärbasen befinden?

Ich arbeite mit den folgenden zwei Datensätzen:

(1) eine Reihe von Punktdaten von Militärbasen in den kontinentalen USA und ihren entsprechenden Truppenstufen:

Standorte von US-Militäreinrichtungen in den unteren 48

(2) eine Reihe landesweiter Daten zu Gewaltkriminalitätsraten nach Städten:

Ausmaß der Gewaltkriminalität in den USA nach Städten

Ich habe das Gefühl, ich suche nach einem schwerkraftbasierten Modell, bei dem die "Massen" -Funktion an jeder Basis Truppenstufen angibt. Eine große Truppenpräsenz würde also Einfluss auf ein größeres Gebiet ausüben und in der Nähe des Massenschwerpunkts (dh der Punktposition in der GIS-Schicht) eine stärkere Wirkung haben.

Ich denke, dass es konzeptionell ungefähr so ​​aussehen würde: Schwerkraftmodell - Abstandsabfalldiagramm

In diesem Diagramm repräsentieren X, Y, Z Militärbasen. a, b, c, d repräsentieren jeweils Städte (von denen jede ein Gewaltratenfeld in ihrer Attributtabelle hat).

Der Gradient um die Basen stellt das Einflussfeld dar, das mit der Entfernung vom Basisschwerpunkt exponentiell abnimmt. Eine größere Truppenpräsenz entspricht einem größeren Einflussradius (mit einem gewissen maximalen Schwellenabstand) und auch einem stärkeren Einfluss in der Nähe des Zentrums im Vergleich zu den Bereichen in der Nähe einer kleineren Basis.

Jeder Stadt wird eine Punktzahl zugewiesen, die auf der Summierung der Größe aller "Kraft" -Vektoren aller umgebenden Basen basiert, in deren Einflussradius sie liegen. In meinem Diagramm hätte Stadt a beispielsweise eine Punktzahl von 0, da sie liegt außerhalb des Radius einer Basis. Stadt b würde nur von Basis X beeinflusst . Stadt c würde nur von der Basis Z beeinflusst und ihre Punktzahl wäre niedriger als b , da X eine viel größere Basis als Z ist . Schließlich liegt Stadt d im Radius der beiden Basen X und Y.würde es eine Bewertung erhalten, die auf der Summierung des Ausmaßes des Einflusses von beiden Basen basiert. Ich würde dann sehen, ob es einen Zusammenhang zwischen einer höheren Punktzahl für eine Stadt und einer höheren Gewaltrate gibt.

Ich habe mich mit verschiedenen schwerkraftbasierten Modellen befasst ( Huff-Modelle usw.), konnte jedoch bis zu QGIS / Python nicht viel finden und bin mir nicht ganz sicher, wie ich das oben beschriebene implementieren soll ... Hat jemand Vorschläge dafür? Hat jemand von Ihnen diese Art von Analyse schon in anderen Bereichen durchgeführt?

Die TLDR lautet also:

  • Welche statistischen Techniken könnte ich für diese Art von Frage verwenden?
  • Gibt es in QGIS integrierte Tools (oder als Plugins verfügbar), die dies tun können?
  • Wenn es in QGIS nichts Vergleichbares gibt, gibt es Python-Bibliotheken, die diese Art von Analyse durchführen können?
J. Taylor
quelle
Um ganz klar zu sein, ich bin mir bewusst, dass es eine Menge anderer Faktoren gibt, die mit der Gewaltrate (Armut, städtische Dichte usw.) ins Spiel kommen, aber bitte nehmen Sie der Einfachheit halber an, dass es keine signifikanten verwirrenden Variablen gab und dass ich es nur war Betrachtung der Korrelation zwischen diesen beiden Variablen (Truppenstärke und Gewaltrate). An diesem Punkt ist dies nur eine Lernübung, und ich versuche herauszufinden, welche Tools mir zur Verfügung stehen. Vielen Dank!
J. Taylor
1
Um Ihre dritte Frage zu beantworten, habe ich PySAl gefunden, das von Prof. Luc Anselin entwickelt wurde und der es wert ist, angesichts Ihrer Interessen nachgeschlagen zu werden. Er hat auch an GeoDa gearbeitet, einer sofort einsatzbereiten Lösung für das, was Sie sich ansehen. Möglicherweise gibt es ein PySAl-Plugin für QGIS? pysal.readthedocs.org/en/latest
Raphael

Antworten:

2

Erweitern Sie meinen Kommentar oben

Am Ende möchten Sie wahrscheinlich eine lineare Regression mit räumlicher Verzögerung ausführen, die die räumliche Korrelation einiger Ihrer Variablen berücksichtigt (ich muss mir dazu meine Notizen ansehen).

Luc Anselin war ein Pionier auf diesem Gebiet, und Sie sollten sich seine Arbeit ansehen, insbesondere die (kostenlosen) Tools und Dokumentationen im GeoDa Center . Beide Tools könnten für Sie von Interesse sein:

  1. GeoDa, eine eigenständige Software zur Untersuchung der räumlichen (automatischen) Korrelation.
  2. PySAL , eine Python-Bibliothek für räumliche Analysen.

Meine Suche nach einem PySAL-Plugin für QGIS ergab etwas, das seit Jahren nicht mehr aktualisiert wurde, aber Sie haben möglicherweise mehr Glück.

Raphael
quelle
Danke Raphael. Ich werde mich eingehender mit dem Konzept der "linearen Regression mit räumlicher Verzögerung" befassen. Ich war bereits auf PySAL / GeoDa gestoßen, dank einer Empfehlung auf dem IRC-Kanal #qgis. Sie haben Recht, dass ein Großteil der Dokumentation auf der GeoDa-Seite hilfreich war. Ich habe immer noch nichts gefunden, das genau das tut, was ich will, aber wenn ich es selbst codieren muss, gibt es dort viele Tools, die so aussehen, als wären sie nützliche "Bausteine".
J. Taylor