Ein gewöhnlicher Signifikanztest bei der Betrachtung von zwei Populationen ist der T-Test, wenn möglich der gepaarte T-Test. Dies setzt voraus, dass die Verteilung normal ist.
Gibt es ähnliche vereinfachende Annahmen, die einen Signifikanztest für eine Zeitreihe ergeben? Insbesondere haben wir zwei relativ kleine Populationen von Mäusen, die unterschiedlich behandelt werden, und wir messen einmal pro Woche das Gewicht. Beide Diagramme zeigen gleichmäßig ansteigende Funktionen, wobei ein Diagramm eindeutig über dem anderen liegt. Wie quantifizieren wir in diesem Zusammenhang die "Bestimmtheit"?
Die Nullhypothese sollte lauten, dass sich die Gewichte der beiden Populationen im Laufe der Zeit "gleich verhalten". Wie kann man dies in Form eines einfachen Modells formulieren, das mit nur wenigen Parametern ziemlich häufig ist (so wie normale Verteilungen üblich sind)? Wie kann man dann die Signifikanz oder etwas Analoges zu p-Werten messen? Was ist mit der Paarung der Mäuse, die so viele Merkmale wie möglich aufweisen, wobei jedes Paar einen Vertreter aus jeder der beiden Populationen hat?
Ich würde einen Hinweis auf ein relevantes, gut geschriebenes und leicht verständliches Buch oder einen Artikel über Zeitreihen begrüßen. Ich fange als Ignorant an. Danke für Ihre Hilfe.
David Epstein
quelle
Antworten:
Es gibt viele Möglichkeiten, dies zu tun, wenn Sie Gewichtsschwankungen als dynamischen Prozess betrachten.
Als Referenz kann ich dieses Buch vorschlagen .
quelle
Ich würde vorschlagen, ein ARIMA-Modell für jede Maus separat zu identifizieren und sie dann auf Ähnlichkeiten und Verallgemeinerungen zu überprüfen. Wenn zum Beispiel die ersten Mäuse ein AR (1) und die zweiten ein AR (2) haben, wäre das allgemeinste (größte) Modell ein AR (2). Schätzen Sie dieses Modell global, dh für die kombinierten Zeitreihen. Vergleichen Sie die Fehlersumme der Quadrate für die kombinierte Menge mit der Summe der beiden einzelnen Fehlersummen der Quadrate, um einen F-Wert zu generieren und die Hypothese konstanter Parameter über Gruppen hinweg zu testen. Ich wünschte, Sie könnten Ihre Daten posten und ich werde diesen Test genau veranschaulichen.
ZUSÄTZLICHE KOMMENTARE:
Da der Datensatz automatisch korreliert ist, gilt die Normalität nicht. Wenn die Beobachtungen über die Zeit unabhängig sind, kann man einige der bekannten Nicht-Zeitreihenmethoden anwenden. In Bezug auf Ihre Anfrage nach einem einfach zu lesenden Buch über Zeitreihen schlage ich den Wei-Text von Addison-Wesley vor. Sozialwissenschaftler werden feststellen, dass der nicht-mathematische Ansatz von Mcleary und Hay (1980) intuitiver, aber nicht konsequent genug ist.
quelle