Analyse der Kreuzkorrelation zwischen Punktprozessen

15

Ich möchte einen Rat zu einer Analysemethode, die ich verwende, einholen, um zu wissen, ob sie statistisch stichhaltig ist.

Ich habe zwei Punkt gemessen verarbeitet und T 2 = t 2 1 , t 2 2 , . . . , t 2 m und ich möchte feststellen, ob die Ereignisse in T 1 in irgendeiner Weise mit den Ereignissen in T 2 korreliert sind .T1=t11,t21,...,tn1T2=t12,t22,...,tm2T1T2

Eine der Methoden, die ich in der Literatur gefunden habe, ist die Erstellung eines Kreuzkorrelationshistogramms: Für jedes finden wir die Verzögerung für alle Ereignisse von T 2 , die in ein bestimmtes Zeitfenster fallen (vor und nach t 1 n ), und dann konstruieren wir ein Histogramm all dieser Verzögerungen.tn1T2tn1

Wenn die beiden Prozesse nicht korrelieren, würde ich ein flaches Histogramm erwarten, da die Wahrscheinlichkeit, ein Ereignis in nach (oder vor) einem Ereignis in T 1 zu haben, bei allen Verzögerungen gleich ist. Wenn das Histogramm hingegen einen Peak enthält, deutet dies darauf hin, dass sich die Zweipunktprozesse gegenseitig beeinflussen (oder zumindest einen gemeinsamen Input haben).T2T1

Nun, das ist schön und gut, aber wie kann ich feststellen, ob die Histogramme einen Peak haben (ich muss sagen, dass sie für meinen speziellen Datensatz eindeutig flach sind, aber es wäre trotzdem schön, einen statistischen Weg von das bestätigen)?

Also, hier, was ich getan habe: Ich habe den Vorgang des Erzeugens des Histogramms mehrere (1000) Male wiederholt, wobei unverändert blieb und eine "gemischte" Version von T 2 verwendet wurde . Um T 2 zu mischen, berechne ich die Intervalle zwischen allen Ereignissen, mische sie und summiere sie, um einen neuen Punktprozess wiederherzustellen. In RI mache ich das einfach mit:T1T2T2

times2.swp <- cumsum(sample(diff(times2)))

T2T1

T2T1

Ich würde dann diesen 95% -Wert für alle Zeitverzögerungen nehmen und ihn als ein gewisses "Konfidenzlimit" verwenden (wahrscheinlich ist dies nicht der richtige Begriff), damit alles, was dieses Limit im ursprünglichen Histogramm überschreitet, als "wahr" betrachtet werden kann Gipfel".

Frage 1 : Ist diese Methode statistisch korrekt? Wenn nicht, wie würden Sie dieses Problem angehen?

Frage 2 : Eine andere Sache, die ich sehen möchte, ist, ob es eine "längere" Art der Korrelation meiner Daten gibt. Beispielsweise kann es in den Zweipunktprozessen zu ähnlichen Änderungen der Ereignisrate kommen (beachten Sie, dass sie möglicherweise sehr unterschiedliche Raten haben), aber ich bin mir nicht sicher, wie ich das tun soll. Ich dachte daran, eine "Hüllkurve" für jeden Punktprozess mit einer Art Glättungskernel zu erstellen und dann eine Kreuzkorrelationsanalyse der beiden Hüllkurven durchzuführen. Können Sie eine andere Art der Analyse vorschlagen?

Vielen Dank und Entschuldigung für diese sehr lange Frage.

nico
quelle

Antworten:

11

Eine Standardmethode zur Analyse dieses Problems in zwei oder mehr Dimensionen ist die (Kreuz-) K-Funktion von Ripley , aber es gibt keinen Grund, sie auch nicht in einer Dimension zu verwenden. (Mit einer Google-Suche können Sie gut Referenzen ausgraben.) Im Wesentlichen zeichnet sie die CDF aller Abstände zwischen Punkten in den beiden Realisierungen und nicht eine Histogramm-Annäherung an die PDF-Datei dieser Abstände. (Eine Variante, die L-Funktion, zeichnet die Differenz zwischen K und der Nullverteilung für zwei gleichförmige, nicht korrelierte Prozesse auf.) Dies umgeht die meisten Probleme, die Sie mit der Notwendigkeit konfrontiert sind, Behälter zu wählen, zu glätten usw. Konfidenzbänder für K werden in der Regel durch Simulation erstellt. Dies ist in R einfach zu bewerkstelligen. Viele räumliche Statistikpakete für R können direkt verwendet oder einfach an diesen 1D-Fall angepasst werden. Roger BivandsDie Übersichtsseite von CRAN listet diese Pakete auf: siehe Abschnitt "Punktmusteranalyse".

whuber
quelle
Interessant ... Ich bin im Moment ein bisschen beschäftigt, aber ich werde mir das auf jeden Fall ansehen!
Nico