Eine Datenbank mit (Bevölkerung, Fläche, Form) kann verwendet werden, um die Bevölkerungsdichte abzubilden, indem jeder Form ein konstanter Wert für Bevölkerung / Fläche zugewiesen wird (dies ist ein Polygon wie ein Zensusblock, ein Gebiet, eine Grafschaft, ein Bundesland usw.). Die Populationen sind jedoch normalerweise nicht gleichmäßig in ihren Polygonen verteilt. Die dasymetrische Abbildung ist der Prozess der Verfeinerung dieser Dichteschätzungen mithilfe von Hilfsdaten. Es ist ein wichtiges Problem in den Sozialwissenschaften, wie aus dieser jüngsten Überprüfung hervorgeht.
Nehmen wir also an, wir hätten eine Hilfskarte der Landbedeckung (oder einen anderen diskreten Faktor) zur Verfügung. Im einfachsten Fall können wir offensichtlich unbewohnbare Gebiete wie Gewässer zur Abgrenzung dessen verwenden, wo die Bevölkerung nicht ist, und dementsprechend die gesamte Bevölkerung den verbleibenden Gebieten zuordnen. Allgemeiner wird jede Zählungseinheit in Abschnitte mit Oberflächenbereichen , geschnitten . Unser Datensatz wird dadurch um eine Liste von Tupeln erweitert
Dabei ist die Grundgesamtheit (angenommen, fehlerfrei gemessen) in der Einheit und obwohl dies nicht unbedingt der Fall ist, können wir annehmen, dass jedes auch genau gemessen wird. In diesen Begriffen besteht das Ziel darin, jedes in eine Summe aufzuteilen
wobei jedes und schätzt die Population innerhalb der Einheit in der Bodenbedeckung Klasse wohn . Die Schätzungen müssen unvoreingenommen sein. Diese Partition verfeinert die Bevölkerungsdichtekarte, indem die Dichte dem Schnittpunkt des Volkszählungspolygons und der Landbedeckungsklasse zugewiesen wird.
Dieses Problem unterscheidet sich in wesentlichen Punkten von den Standardeinstellungen für die Regression:
- Die Aufteilung jedes muss exakt sein.
- Die Komponenten jeder Partition dürfen nicht negativ sein.
- Es gibt (unter der Annahme) keinen Fehler in irgendwelchen Daten: Alle Bevölkerungszählungen und alle Bereiche x j i sind korrekt.
Es gibt viele Lösungsansätze, wie zum Beispiel die " Intelligent dasymetric mapping " -Methode, aber alle, über die ich gelesen habe, haben Ad-hoc- Elemente und ein offensichtliches Verzerrungspotential. Ich suche Antworten, die kreative, rechnergestützte statistische Methoden vorschlagen. Der sofortige Antrag betrifft eine Sammlung von c. - 10 6 Volkszählungs-Einheiten mit durchschnittlich 40 Personen pro Person (obwohl ein beträchtlicher Teil 0 Personen hat) und ungefähr einem Dutzend Landbedeckungsklassen.
quelle
Antworten:
Vielleicht möchten Sie die Arbeit von Mitchel Langford auf dasymetrische Mapping überprüfen.
Er erstellt Raster, die die Bevölkerungsverteilung in Wales darstellen, und einige seiner methodologischen Ansätze könnten hier nützlich sein.
Update: Vielleicht sehen Sie sich auch die Arbeit von Jeremy Mennis an (insbesondere diese beiden Artikel).
quelle
Interessante Frage. Hier ist ein vorläufiger Versuch, dies aus einem statistischen Blickwinkel zu betrachten. Angenommen, wir haben eine Möglichkeit gefunden, jedem Bereich x j i eine Bevölkerungszahl zuzuweisenxji . Bezeichnen Sie diese Beziehung wie folgt:
Es ist klar, welche funktionale Form wir auch immerf(.) Auferlegen, bestenfalls eine Annäherung an die reale Beziehung und damit die Notwendigkeit darstellt, Fehler in die obige Gleichung aufzunehmen. So wird das Obige:
wo,
Die Annahme eines Verteilungsfehlers für den Fehlerausdruck dient nur zur Veranschaulichung. Bei Bedarf können wir dies gegebenenfalls ändern.
Wir brauchen jedoch eine genaue Zerlegung von . Daher müssen wir die Fehlerbegriffe und die Funktion f ( . ) Wie folgt einschränken :yji f(.)
Bezeichne den gestapelten Vektor von mit z j und die gestapelten deterministischen Terme von f ( x j i , β ) mit f j . Somit haben wir:zji zj f(xji,β) fj
wo,
ist ein Vektor mit einer geeigneten Dimension.e
Die erste Indikatorbeschränkung erfasst die Idee, dass die Summe der deterministischen Terme zu und die zweite die Idee, dass die Fehlerreste zu 0 summieren sollen.yj
Bearbeiten 1
Wenn man etwas mehr darüber nachdenkt, kann die obige Formulierung vereinfacht werden, da sie mehr Einschränkungen als nötig hat.
wo,
Bezeichne den gestapelten Vektor von z j i mit z j und die gestapelten deterministischen Terme von f ( x j i , β ) mit f j .zji zj f(xji,β) fj
wo,
quelle