Was ist der Unterschied zwischen räumlicher Abhängigkeit und räumlicher Heterogenität?

Meine Frage ist motiviert durch Lesungen in Modellspezifikationsproblemen in der räumlichen Ökonometrie, insbesondere Anselin (2010) .

econometrics spatial mindless.panda
quelle

Referenz wäre nützlich. Aus meiner persönlichen Erfahrung ist noch nicht jede Terminologie in der räumlichen Ökonometrie festgelegt, dh verschiedene Autoren könnten unterschiedliche Definitionen geben.

mpiktas

Ich habe das Gefühl, Luc Anselin hat 2010 mehr als eine Arbeit geschrieben! Ein spezifischeres Zitat (plus einen Link) wäre nützlich (obwohl er diese Begriffe seit seinem 1988 gedruckten Buch "Spatial Econometrics" verwendet hat ).

Andy W

Vielen Dank für den Vorschlag - ich habe einen Link zum Artikel hinzugefügt.

mindless.panda

Antworten:

Diese Begriffe haben wahrscheinlich keine allgemein akzeptierte technische Definition, aber ihre Bedeutung ist ziemlich klar: Sie beziehen sich auf Variationen zweiter Ordnung bzw. erster Ordnung eines räumlichen Prozesses. Nehmen wir sie auf Bestellung, nachdem wir zuerst einige Standardkonzepte vorgestellt haben.

Ein räumlicher Prozess oder ein räumlicher stochastischer Prozess kann als eine Sammlung von Zufallsvariablen betrachtet werden, die durch Punkte in einem Raum indiziert sind. (Die Variablen müssen einige natürliche technische Konsistenzbedingungen erfüllen, um als Prozess zu gelten: siehe den Kolmogorov-Erweiterungssatz .)

Beachten Sie, dass ein räumlicher Prozess ein Modell ist. Es ist gültig, mehrere verschiedene (widersprüchliche) Modelle zu verwenden, um dieselben Daten zu analysieren und zu beschreiben. Beispielsweise können Modelle natürlich vorkommender Metallkonzentrationen in Böden für kleine Regionen (z. B. einen Hektar oder weniger) rein stochastisch sein, während es in großen Regionen (die sich über viele Kilometer erstrecken) normalerweise wichtig ist, die zugrunde liegenden regionalen Trends deterministisch zu beschreiben - das heißt. als eine Form der räumlichen Heterogenität.

Die räumliche Heterogenität ist eine Eigenschaft eines räumlichen Prozesses, dessen Mittelwert (oder "Intensität") von Punkt zu Punkt variiert.

Der Mittelwert ist eine Eigenschaft erster Ordnung einer Zufallsvariablen (dh bezogen auf ihren ersten Moment), aus der räumliche Heterogenität als Eigenschaft erster Ordnung eines Prozesses betrachtet werden kann.

Die räumliche Abhängigkeit ist eine Eigenschaft eines räumlichen stochastischen Prozesses, bei dem die Ergebnisse an verschiedenen Orten abhängig sein können.

Oft können wir die Abhängigkeit anhand der Kovarianz (zweiter Moment) oder der Korrelation der Zufallsvariablen messen: In diesem Sinne kann die Abhängigkeit als Eigenschaft zweiter Ordnung betrachtet werden. (Sticklers werden schnell darauf hinweisen, dass Korrelation und Unabhängigkeit nicht gleich sind, so dass die Gleichsetzung von Abhängigkeit mit Eigenschaften zweiter Ordnung, obwohl intuitiv hilfreich, nicht allgemein gültig ist.)

Wenn Sie Muster in räumlichen Daten sehen, können Sie diese normalerweise entweder als Heterogenität oder Abhängigkeit (oder beides) beschreiben, abhängig vom Zweck der Analyse, den vorherigen Informationen und der Datenmenge.

Einige einfache, gut untersuchte Beispiele veranschaulichen diese Ideen.

Ein Poisson-Prozess mit unterschiedlicher Intensität ist räumlich heterogen, weist jedoch keine räumliche Abhängigkeit auf.

Poisson-Prozess

In dieser Figur grenzt das Quadrat einen Bereich mit höherer räumlicher Intensität ab. Alle Punktpositionen sind jedoch unabhängig: Die Clusterbildung und Lücken in Punkten sind typisch für unabhängige zufällig ausgewählte Positionen.

Ein Nachbarschaftsmittel oder eine Faltung eines "weißen Rausch" -Prozesses ist räumlich homogen, weist jedoch eine räumliche Abhängigkeit auf.

Gaußscher Filter

Die räumliche Abhängigkeit in diesem Gaußschen Prozess wird durch die Muster von Graten und Tälern deutlich. Sie sind jedoch homogen: Insgesamt gibt es keinen Trend. Beachten Sie jedoch, dass wir uns, wenn wir uns auf einen kleinen Teil dieses Bereichs konzentrieren, möglicherweise dafür entscheiden, ihn stattdessen als inhomogenen Prozess (dh mit einem Trend) zu behandeln. Dies zeigt, wie die Skalierung das von uns ausgewählte Modell beeinflussen kann.

Der vorherige Prozess, der einer deterministischen Funktion hinzugefügt wurde, erzeugt einen Prozess, der räumlich abhängig und heterogen ist.

Abhängiger heterogener Prozess

Dieses Bild zeigt eine andere Realisierung der Zufallskomponente dieses Prozesses als in der vorherigen Abbildung verwendet, sodass die Muster kleiner Wellen nicht genau die gleichen wie zuvor sind - sie haben jedoch die gleichen statistischen Eigenschaften.

whuber
quelle

Erstaunliche Antwort, wie immer - sehr klare Beispiele.

Matt Parker

Tatsächlich eine erstaunliche Antwort. Eine kleine zusätzliche Frage / Kommentar: Wenn es einen Trend in den Daten gibt (räumliche Heterogenität), dann gibt es Bereiche, in denen enge Beobachtungen ähnlich sind / den gleichen Mittelwert haben. Folgt daraus nicht, dass diese Beobachtungen zumindest informell räumlich abhängig sind?

Julian

@ Julian Ja, das ist ganz richtig. Aus diesem Grund kann die zugrunde liegende Form des Prozesses nicht allein anhand einer Prüfung der Daten eindeutig identifiziert werden. Weitere Informationen finden Sie in meiner Antwort unter stats.stackexchange.com/a/35524, in der Ihre Schlussfolgerung durch eine formale Berechnung gestützt wird.

whuber

@ Julian Das stimmt. Es ist teilweise eine Frage des Maßstabs: Bei einem großen Maßstab (der über das letzte Bild hinausgeht) könnte man sich dafür entscheiden, alle Variationen als zufällig mit weitreichenden Korrelationen zu modellieren. Auf der gezeigten Skala könnte die bessere Wahl darin bestehen, die "säkulare" Variation mit größerer Reichweite als deterministischen Trend zu modellieren. Es gibt nicht genügend Informationen auf der Bildskala, um zu entscheiden, welches das bessere Modell ist, aber es gibt nicht wirklich genug Informationen, um ein vollständig zufälliges Modell zu erstellen. Andere Informationen (nicht in den Daten enthalten) können häufig bei der Auswahl des geeigneten Modells hilfreich sein.

whuber

@Julian Das relevante Konzept ist die Stationarität: In einem stationären Prozess ändern sich einige der Merkmale der im Modell verwendeten Zufallsvariablen nicht mit dem Standort. Die grundlegendste Form der Stationarität ist, wenn die Erwartungen der Variablen nicht variieren. Kein Trend erzeugt eindeutig ein stationäres Modell. Das ist jedoch nicht so problematisch, wie Sie vielleicht denken, da Sie normalerweise den Trend von den Daten subtrahieren und versuchen können, ein stationäres Modell für die Unterschiede zu verwenden. GWR wird dies automatisch behandeln, wenn Sie lat und lon zu den erklärenden Variablen hinzufügen.

whuber

Der Begriff der räumlichen Heterogenität in der aktuellen räumlichen Statistik wird nur verwendet, um die lokale Varianz der räumlichen Abhängigkeit oder Regression zu charakterisieren. Ich schlug eine breite Perspektive auf räumliche Heterogenität vor, die sich auf das Skalierungsmuster von weitaus mehr kleinen als großen Dingen bezieht. Wichtig ist, dass das Skalierungsmuster mehrmals wiederholt wird, gemessen am ht-Index.

https://www.researchgate.net/publication/236627484_Ht-Index_for_Quantifying_the_Fractal_or_Scaling_Structure_of_Geographic_Features

Nach der neuen Definition sollte räumliche Heterogenität als Skalierungsgesetz formuliert werden. Somit ist die Heterogenität eher wie das Potenzgesetz als wie die Gaußsche Verteilung.

Mit dieser breiten Perspektive zeigen sowohl räumliche Abhängigkeit als auch Heterogenität das wahre Bild der Erdoberfläche. Es gibt weit mehr kleine Dinge als große auf allen Skalen oder global, aber die Dinge sind auf einer Skala oder lokal mehr oder weniger ähnlich. Weitere Informationen finden Sie in diesem Dokument.

https://www.researchgate.net/publication/282310447_A_Fractal_Perspective_on_Scale_in_Geography

Bin Jiang
quelle

Ich denke, dieser Beitrag würde von einem expliziteren Vergleich (insbesondere unter Hinweis auf Unterschiede) zwischen Heterogenität und Abhängigkeit profitieren. Die Frage stellte sich, was der Unterschied zwischen den beiden ist. Ich kann sehen, dass "sowohl räumliche Abhängigkeit als auch Heterogenität ein wahres Bild der Erdoberfläche darstellen" eine Ähnlichkeit zwischen den Konzepten feststellt, aber was ist der Unterschied zwischen ihnen? Stellen sie dieses Bild auf unterschiedliche Weise dar?

Silverfish

Es gibt einen großen Unterschied zwischen den beiden unter der neuen Definition von Heterogenität, aber einen kleinen Unterschied zwischen den beiden unter der alten Definition von Heterogenität. Nach der alten Definition bezieht sich räumliche Heterogenität darauf, wie sich die räumliche Abhängigkeit oder Regression von einem lokalen Ort zum anderen unterscheidet. Unter der neuen Definition von Heterogenität (die im Wesentlichen dieselbe Definition wie in anderen Wissenschaften wie Biologie und Physik ist) wird räumliche Heterogenität als universelles und allgemeines Skalierungsgesetz formuliert. Ich denke, die Unterscheidung ist nicht nur technisch, sondern auf der Ebene des Paradigmas.

Bin Jiang

Vielen Dank. Ich denke, die Antwort würde davon profitieren, wenn ein Teil dieser Diskussion aufgenommen würde (unten befindet sich eine Schaltfläche zum Bearbeiten). Ich schätze, dass dies in den verlinkten Artikeln behandelt wird, aber wir möchten, dass unsere Antworten in sich geschlossen sind, anstatt sich auf externe Links zu verlassen.

Silverfish

Die Frage hängt von der mathematischen Definition der beiden Konzepte ab. Es gibt bereits mehrere Definitionen der räumlichen Autokorrelation wie Morans I, aber nur wenige der räumlichen Heterogenität, wahrscheinlich weil letztere skalenabhängig ist und sich in verschiedenen Skalen unterscheiden würde. Ich habe die räumlich geschichtete Heterogenität definiert (das vollständige Papier wird online am 12. März 2016 in der Zeitschrift Ecological Indicators erwartet):

Ein Maß für die räumlich geschichtete Heterogenität

Jin-Feng Wang1 *, Tong-Lin Zhang2, Bo-Jie Fu3

ABSTRAKT

Die räumlich geschichtete Heterogenität, die sich auf die Varianz innerhalb der Schichten bezieht, die geringer ist als die Varianz zwischen den Schichten, ist in ökologischen Phänomenen wie ökologischen Zonen und vielen ökologischen Variablen allgegenwärtig. Die räumlich geschichtete Heterogenität spiegelt das Wesen der Natur wider, impliziert potenziell unterschiedliche Mechanismen nach Schichten, schlägt mögliche Determinanten des beobachteten Prozesses vor, ermöglicht die Repräsentativität von Beobachtungen der Erde und erzwingt die Anwendbarkeit statistischer Schlussfolgerungen. In diesem Artikel schlagen wir eine q-statistische Methode vor, um den Grad der räumlich geschichteten Heterogenität zu messen und ihre Bedeutung zu testen. Der q-Wert liegt innerhalb von [0, 1] (0, wenn eine räumliche Schichtung der Heterogenität nicht signifikant ist, und 1, wenn eine perfekte räumliche Schichtung der Heterogenität vorliegt). Die genaue Wahrscheinlichkeitsdichtefunktion wird abgeleitet. Die q-Statistik wird anhand von zwei Beispielen veranschaulicht, in denen wir die räumlich geschichteten Heterogenitäten einer Handkarte und die Verteilung des jährlichen NDVI in China bewerten. - Jinfeng Wang 2016-3-8

user107803
quelle