Nullwerte in der geografisch gewichteten Regressionsanalyse

12

Einige meiner erklärenden Variablen haben für bestimmte Polygone einige Nullwerte.

Kann die geografisch gewichtete Regressionsanalyse diese verarbeiten oder sollte ich das gesamte Polygon und alle Daten (abhängige und unabhängige Variablen für dieses bestimmte Polygon) entfernen?

I Herzschläge
quelle
Was bedeuten diese Nullen? Dass ein Wert nicht zutreffend ist oder existiert, aber unbekannt ist? Wenn letzteres, warum ist es unbekannt? (Die Hauptsorge ist, ob der Grund dafür, dass ein Wert unbekannt ist, in irgendeiner Weise mit dem Wert selbst zusammenhängt. Wenn Sie beispielsweise Hydrologie studieren und die Landbedeckung als erklärende Variable verwenden, ist die Landbedeckung aufgrund von Überschwemmungen nicht bekannt.) Das ist eine wichtige Information und bedeutet viel mehr als nur einen fehlenden Wert.)
whuber
1
Vielen Dank. Einige der Nullen stellen Daten dar, die aus Gründen der Vertraulichkeit aufgrund kleiner Aggregationseinheiten ausgelassen wurden, andere waren einfach nicht verfügbar, aber nicht aufgrund der erklärenden Variablen, die andere Variablen betreffen. Ich habe echte Nullwerte, wobei die Null kein Ereignis / keine Rate für dieses bestimmte Polygon darstellt, und ich habe auch einige Nullwerte, bei denen die Daten fehlen. Da ich zu Beginn ungefähr 29 erklärende Variablen habe, wenn ich die Polygone herausnehme, bei denen für die Zeilen, die Nullen enthalten, ich 8 von 279 Polygonen verliere, und ich hoffte, dass ich nicht musste. Vielen Dank!
I Heart Beats
Ich bin froh, dass Sie Informationen und Theorien über das Fehlen haben. Sie sollten bei diesen kleinen Einheiten vorsichtig sein, da die Werte von fast jeder Variablen plausibel mit der Größe der Region in Beziehung gesetzt werden können, die sie darstellt, wodurch eine potenzielle Verzerrung des Musters der Fehlenden entsteht.
whuber
2
Sie können Nullen einbeziehen, indem Sie Variablen einführen, um deren Vorhandensein anzuzeigen, und alle ursprünglichen Nullergebnisse mit einem gemeinsamen Wert codieren (der von Ihnen gewählte Wert spielt keine Rolle). Sie benötigen einen separaten Indikator für jede Variable, die Nullen enthält. Was auch immer Sie tun, ersetzen Sie Nullen nicht einfach durch Nullen (oder irgendeine andere Konstante)! Eine Null bedeutet etwas ganz anderes als Null.
whuber
1
@whuber Es sieht so aus, als ob Ihre Kommentare ausreichend sind, um eine Antwort auf diese Frage zu verfassen.
PolyGeo

Antworten:

1

Sie können versuchen, die Nullwerte aus den Umgebungsdaten zu erraten. Das wäre besser, als sie wegzulassen, denn auf diese Weise verlieren Sie keine Daten. Natürlich muss man vorsichtig sein, wie man die Werte errät. Denn wenn Ihre Vermutung voreingenommen ist, wird Ihr Modell auch sein.

Siehe auch: http://handbook.cochrane.org/chapter_16/16_1_2_general_principles_for_dealing_with_missing_data.htm

und:

Vorsicht:

Denken Sie bei der Verwendung von Shapefiles immer daran, dass sie keine Nullwerte speichern können. Tools oder andere Prozeduren, die Shapefiles aus nicht-Shapefile-Eingaben erstellen, können daher Nullwerte als Null oder als eine sehr kleine negative Zahl speichern (-DBL_MAX = -1.7976931348623158e + 308). Dies kann zu unerwarteten Ergebnissen führen. Siehe auch: Überlegungen zur Geoverarbeitung für die Shapefile-Ausgabe. ( http://desktop.arcgis.com/de/arcmap/10.3/tools/spatial-statistics-toolbox/geographically-weighted-regression.htm )

LMB
quelle