Ich möchte einen Rat zu einer Analysemethode, die ich verwende, einholen, um zu wissen, ob sie statistisch stichhaltig ist.
Ich habe zwei Punkt gemessen verarbeitet und T 2 = t 2 1 , t 2 2 , . . . , t 2 m und ich möchte feststellen, ob die Ereignisse in T 1 in irgendeiner Weise mit den Ereignissen in T 2 korreliert sind .
Eine der Methoden, die ich in der Literatur gefunden habe, ist die Erstellung eines Kreuzkorrelationshistogramms: Für jedes finden wir die Verzögerung für alle Ereignisse von T 2 , die in ein bestimmtes Zeitfenster fallen (vor und nach t 1 n ), und dann konstruieren wir ein Histogramm all dieser Verzögerungen.
Wenn die beiden Prozesse nicht korrelieren, würde ich ein flaches Histogramm erwarten, da die Wahrscheinlichkeit, ein Ereignis in nach (oder vor) einem Ereignis in T 1 zu haben, bei allen Verzögerungen gleich ist. Wenn das Histogramm hingegen einen Peak enthält, deutet dies darauf hin, dass sich die Zweipunktprozesse gegenseitig beeinflussen (oder zumindest einen gemeinsamen Input haben).
Nun, das ist schön und gut, aber wie kann ich feststellen, ob die Histogramme einen Peak haben (ich muss sagen, dass sie für meinen speziellen Datensatz eindeutig flach sind, aber es wäre trotzdem schön, einen statistischen Weg von das bestätigen)?
Also, hier, was ich getan habe: Ich habe den Vorgang des Erzeugens des Histogramms mehrere (1000) Male wiederholt, wobei unverändert blieb und eine "gemischte" Version von T 2 verwendet wurde . Um T 2 zu mischen, berechne ich die Intervalle zwischen allen Ereignissen, mische sie und summiere sie, um einen neuen Punktprozess wiederherzustellen. In RI mache ich das einfach mit:
times2.swp <- cumsum(sample(diff(times2)))
Ich würde dann diesen 95% -Wert für alle Zeitverzögerungen nehmen und ihn als ein gewisses "Konfidenzlimit" verwenden (wahrscheinlich ist dies nicht der richtige Begriff), damit alles, was dieses Limit im ursprünglichen Histogramm überschreitet, als "wahr" betrachtet werden kann Gipfel".
Frage 1 : Ist diese Methode statistisch korrekt? Wenn nicht, wie würden Sie dieses Problem angehen?
Frage 2 : Eine andere Sache, die ich sehen möchte, ist, ob es eine "längere" Art der Korrelation meiner Daten gibt. Beispielsweise kann es in den Zweipunktprozessen zu ähnlichen Änderungen der Ereignisrate kommen (beachten Sie, dass sie möglicherweise sehr unterschiedliche Raten haben), aber ich bin mir nicht sicher, wie ich das tun soll. Ich dachte daran, eine "Hüllkurve" für jeden Punktprozess mit einer Art Glättungskernel zu erstellen und dann eine Kreuzkorrelationsanalyse der beiden Hüllkurven durchzuführen. Können Sie eine andere Art der Analyse vorschlagen?
Vielen Dank und Entschuldigung für diese sehr lange Frage.