Raumpunktprozess: Beeinflusst eine inhomogene Intensitätsfunktion erster Ordnung die Abhängigkeit zweiter Ordnung?

7

Wie der Titel schon sagt, bin ich etwas verwirrt über den Effekt der Intensitätsfunktion erster Ordnung. Wenn ich eine Intensitätsfunktion erster Ordnung habe, die besagt, dass in einer bestimmten Region die Punkte viel wahrscheinlicher auftreten, bedeutet dies, dass in dieser Region viel mehr Punkte auftreten und es scheint, dass sich die Punkte in dieser Region und anschließend gruppieren legt nahe, dass in dieser Region die Punktmuster gruppiert sind. Es scheint also, dass die Inhomogenität der Intensität erster Ordnung die Intensität zweiter Ordnung beeinflusst.

Mein Verständnis ist, dass die Intensitätsfunktion erster Ordnung das allgemeine Intensitätsniveau angibt, bei dem die Punkte auftreten. Basierend auf dieser Intensität wird dann durch die Intensitätsfunktion zweiter Ordnung bestimmt, ob Punkte in einer bestimmten Region im Vergleich zu einem Poisson-Prozess gleicher Intensität gruppiert oder abstoßend sind.

Wenn mein Verständnis richtig ist, kann jedes Punktmuster als inhomogener Poisson-Prozess angesehen werden, wenn wir die Intensität erster Ordnung so detailliert wie möglich beschreiben. Aber das wird natürlich ein Fall von Überanpassung sein.

Ist dieses Verständnis richtig?

Davidolohowski
quelle

Antworten:

4

Intensität erster Ordnung und Intensität zweiter Ordnung messen verschiedene Aspekte eines Prozesses, die nahezu unabhängig voneinander variiert werden können. Insbesondere kann nicht jeder Punktprozess als inhomogener Poisson-Prozess angesehen werden.

Lassen Sie uns zuerst die letzte Ausgabe behandeln. Betrachten Sie einen homogenen Poisson-Prozess für das Intervall[0,1]]. Die Lücken tendieren dazu, einer Exponentialverteilung zu folgen. Vergleichen wir es mit einem Prozess, der dazu neigt, einen gleichmäßigeren Abstand beizubehalten, einem "geschichteten zufälligen" Prozess. Es wird erstellt, indem das Intervall in tausend nicht überlappende Bins unterteilt und ein einheitlich zufälliger Punkt in jedem Bin ausgewählt wird. Sie haben die gleichen Intensitäten erster Ordnung, wie aus diesen Schätzungen bei einer einzelnen Realisierung jedes Prozesses hervorgeht:

Abbildung 1

Diese Prozesse lassen sich leicht unterscheiden, indem die Intervalle zwischen aufeinanderfolgenden Werten untersucht werden:

Figur 2

Es ist in der Tat so, dass bestimmte Formen der "Clusterbildung" durch die Intensität zweiter Ordnung charakterisiert werden können - aber nicht alle. Clustering kann eine beliebige Kombination von zwei Dingen bedeuten:

  1. Clustering "erster Ordnung" in der Nähe eines Standorts s bedeutet nur, dass es tendenziell mehr Punkte in einer Nachbarschaft von gibt s über alle Realisierungen hinweg.

  2. Clustering "zweiter Ordnung" in der Nähe eines Standorts s bedeutet das Erscheinen eines Punktes in der Nähe von s ist mit dem Auftreten von Punkten an anderen Orten in der Nähe verbunden s.

Das klingt subtil, also lassen Sie uns einige Beispiele gegenüberstellen. Ich habe Realisierungen von zwei Prozessen generiert: einen, der einfach inhomogen ist und eine fünfmal höhere Intensität im Intervall aufweist(0,1/.2]] als auf dem Intervall (1/.2,1]];; und eine andere, die ähnlich inhomogen ist, sich aber im Intervall gruppiert(0,1/.2]]. Um letzteres zu erzeugen, habe ich eine Folge von iid-Exponentialvariablen erstelltdX.ich, multipliziert jeden fünften von ihnen mit 100, und berechnete ihre kumulative Summe X.ich, schließlich durch das Doppelte ihrer Summe teilen, um sie innerhalb des Bereichs zu platzieren (0,1/.2]]. Der Prozess im Intervall (1/.2,1]]ist nach wie vor ein homogener Poisson-Prozess. Dies führte zu einem Prozess, bei dem es tendenziell enge Gruppen von vier Punkten gibt, die alle weit voneinander entfernt sind. Da die dazwischen liegenden Lücken zwischen diesen Punkten zufällig sind, sind die Orte, an denen diese Cluster auftreten, von einer Realisierung zur anderen nicht gleich. Wenn Sie die Möglichkeit haben, mehrere Realisierungen eines Prozesses anzuzeigen, ist dies eine Möglichkeit, Inhomogenität (die von einer Realisierung zur nächsten fortbesteht) von Clustering (das überall auftreten kann, nicht unbedingt an festen Orten) zu unterscheiden.

Figur 3

Die Realisierung jedes Prozesses erscheint unten als Teppichplot. Die Punkte sind ein Streudiagramm der(X.ich,dX.ich)Paare: Das heißt, die Höhen zeichnen die Lücken zum nächsten Punkt rechts. Die Streudiagramme unterscheiden die beiden Prozesse klar.

whuber
quelle
Danke für die Antwort. Dies hat sicherlich die meisten meiner Verwirrungen ausgeräumt. Es stellt mich jedoch auch vor eine andere Frage, und ich möchte dies richtig machen. Ist es wahr, dass, wenn ich den Datenerzeugungsprozess nicht kenne und nur eine Realisierung des Punktprozesses habe, die Inhomogenität erster Ordnung und die Abhängigkeitsstruktur zweiter Ordnung immer nicht zu unterscheiden sind, wie von Ege erwähnt?
Davidolohowski
Ich bin mit dieser Schlussfolgerung nicht einverstanden, da eine Analyse der Lücken des nächsten Nachbarn helfen kann, sie zu unterscheiden. Ich würde zustimmen, dass es in vielen Fällen schwierig sein kann, diese Phänomene zu unterscheiden, aber in einigen Fällen ist dies definitiv möglich.
whuber
Ich war mir wohl nicht klar genug, was ich meinte. Ich meinte, wenn ich nur einen Datensatz eines Punktprozesses habe, von dem ich nichts weiß, z. B. den Clustered-Point-Prozess in Ihrem zweiten Beispiel. Es scheint mir, dass ich in diesem Fall nicht zwischen Inhomogenität erster Ordnung und Abhängigkeitsstruktur zweiter Ordnung unterscheiden kann. Da es mir möglich erscheint, eine sehr detaillierte Intensitätsfunktion erster Ordnung anzupassen, um den Prozess sowie die Lücken der nächsten Nachbarn zu beschreiben. Das ist natürlich überpassend. Trotzdem scheint es meinen Standpunkt zu beweisen.
Davidolohowski
1
Ich stimme zu, dass Sie mit vernünftigen Annahmen etwas Glück haben können, wenn Sie ein einzelnes Punktmuster verwenden, um Inhomogenität und "echte" Clusterbildung (und leichtere Hemmung) aufgrund von Wechselwirkungen zwischen Punkten zu trennen. Sie können sich jedoch immer auf den entarteten Fall beziehen und sagen, dass der zugrunde liegende Prozess inhomogenes Poisson mit praktisch Punktmassen an den beobachteten Punkten ist. Im mathematischen Sinne können Sie also ohne weitere Annahmen wohl keine wirklichen Fortschritte erzielen. Natürlich ist dies aus praktischer Sicht uninteressant und nicht aus einer Sicht, die ich in irgendeiner Weise befürworte.
Ege Rubak
1
@Ege Danke für diese Analyse. Es fällt mir auf, dass das von Ihnen beschriebene Extremmodell eine Art "gesättigtes" Modell mit hoher Parameteranzahl ist, das auf standardmäßige Weise (durch AIC, Kreuzvalidierung usw.) mit anderen sparsamen Modellen verglichen werden kann, wodurch dies möglich wird objektive, informierte Meinungen über die Art des zugrunde liegenden Prozesses entwickeln.
whuber
2

Im Großen und Ganzen klingt Ihr Verständnis richtig. Insbesondere haben Sie Recht, dass es grundsätzlich unmöglich ist, "Inhomogenität erster Ordnung" und "Clusterbildung zweiter Ordnung aufgrund von Wechselwirkungen zwischen Punkten" anhand eines einzelnen Punktmusters zu unterscheiden.

Ege Rubak
quelle
Vielen Dank für die Antwort. Wenn dies der Fall ist, gibt es eine Möglichkeit, eine Abhängigkeitsstatistik zweiter Ordnung zu erhalten, z. B. eine Paarkorrelationsfunktion, nachdem der Effekt der Inhomogenität erster Ordnung ausgeschlossen wurde (vorausgesetzt, ich habe ein Modell zur Beschreibung der Intensität erster Ordnung verwendet)? Gibt es darüber hinaus einen allgemeinen Weg, um festzustellen, ob die Modellierung der Intensitätsfunktion erster Ordnung eine Überanpassung ist?
Davidolohowski
Es ist schwer, allgemein etwas über Überanpassung zu sagen. Statistiken zweiter Ordnung wie die Paarkorrelationsfunktion bei Inhomogenität erster Ordnung zu berücksichtigen, ist in der Tat möglich. Sie benötigen zusätzliche Annahmen wie eine Form der Pseudostationarität (Intensität neu gewichteter Stationarität zweiter Ordnung). Es gibt Details in (dem kostenlosen Beispiel) Kapitel 7 (insbesondere Abschnitt 7.10) des Spatstat-Buches. Haftungsausschluss: Ich bin Mitautor, daher bin ich voreingenommen, wenn ich dies als Referenz verwende - es gibt Unmengen anderer Referenzen.
Ege Rubak