Hypothesentest und Signifikanz für Zeitreihen

19

Ein gewöhnlicher Signifikanztest bei der Betrachtung von zwei Populationen ist der T-Test, wenn möglich der gepaarte T-Test. Dies setzt voraus, dass die Verteilung normal ist.

Gibt es ähnliche vereinfachende Annahmen, die einen Signifikanztest für eine Zeitreihe ergeben? Insbesondere haben wir zwei relativ kleine Populationen von Mäusen, die unterschiedlich behandelt werden, und wir messen einmal pro Woche das Gewicht. Beide Diagramme zeigen gleichmäßig ansteigende Funktionen, wobei ein Diagramm eindeutig über dem anderen liegt. Wie quantifizieren wir in diesem Zusammenhang die "Bestimmtheit"?

Die Nullhypothese sollte lauten, dass sich die Gewichte der beiden Populationen im Laufe der Zeit "gleich verhalten". Wie kann man dies in Form eines einfachen Modells formulieren, das mit nur wenigen Parametern ziemlich häufig ist (so wie normale Verteilungen üblich sind)? Wie kann man dann die Signifikanz oder etwas Analoges zu p-Werten messen? Was ist mit der Paarung der Mäuse, die so viele Merkmale wie möglich aufweisen, wobei jedes Paar einen Vertreter aus jeder der beiden Populationen hat?

Ich würde einen Hinweis auf ein relevantes, gut geschriebenes und leicht verständliches Buch oder einen Artikel über Zeitreihen begrüßen. Ich fange als Ignorant an. Danke für Ihre Hilfe.

David Epstein

David Epstein
quelle
Möglicherweise möchten Sie ein breiteres Netz verwenden, da dies nicht unbedingt eine Zeitreihenfrage ist. In der Tat betrifft die vielleicht grundlegendste Frage hier die beste oder zumindest korrekte Methode zur Quantifizierung eines Behandlungs- "Endpunkts": Ist dies das mittlere Bevölkerungswachstum nach einer bestimmten Zeit, durchschnittliche Wachstumsraten im Laufe der Zeit usw.? Wenn Sie dies vor Beginn des Experiments nicht wussten und plötzlich konstante Unterschiede in den Wachstumskurven bemerken, arbeiten Sie im explorativen und nicht im bestätigenden Modus. Hypothesentests von p-Werten sind trügerisch gut.
whuber
Das Ergebnis ist qualitativ wie erwartet und ein einseitiger Test erscheint angebracht. Der Grund, warum ich nach Zeitreihen gefragt habe, ist, dass man, wenn man nur das Endgewicht misst (welches das relevanteste Maß ist), alle Informationen von früheren Zeitpunkten wegwirft, und das scheint falsch.
David Epstein
Sie haben Recht: Sie wollen diese Daten nicht wegwerfen. Zeitreihentechniken rücken jedoch für Modelle der Daten in den Vordergrund, bei denen zeitliche Korrelationen von Abweichungen von idealisierten Kurven wichtig sind, entweder für ihr eigenes Interesse oder weil sie eine gute Schätzung stören könnten. Es ist unwahrscheinlich, dass Ihre Situation in einen dieser Fälle fällt. Es stehen einfachere, wissenschaftlich sinnvollere Methoden zur Verfügung.
whuber
@whuber, ist das Gewicht der Kontrollgruppe der Mäuse im Laufe der Zeit nicht in gewisser Weise eine "idealisierte Kurve"? Oder zumindest ein theoretisches Modell, das diesen Daten entspricht?
Naught101
1
Ja, @nichts, das ist eine vernünftige Sichtweise. "Kurve" ist jedoch nicht dasselbe wie "Zeitreihe". Beispielsweise kann (und wird) die lineare Regression als Anpassung von Kurven an Daten angesehen, ist jedoch von der Zeitreihenanalyse getrennt, die die Struktur der Korrelationen zwischen Abweichungen zwischen den Daten und der idealisierten Kurve hervorhebt.
whuber

Antworten:

1

Es gibt viele Möglichkeiten, dies zu tun, wenn Sie Gewichtsschwankungen als dynamischen Prozess betrachten.

x˙(t)=θx(t)+v(t)

x(t)θv(t)v(t)N(0,Q.)Q.

θθθ1θ2

Als Referenz kann ich dieses Buch vorschlagen .

andrecb
quelle
0

Ich würde vorschlagen, ein ARIMA-Modell für jede Maus separat zu identifizieren und sie dann auf Ähnlichkeiten und Verallgemeinerungen zu überprüfen. Wenn zum Beispiel die ersten Mäuse ein AR (1) und die zweiten ein AR (2) haben, wäre das allgemeinste (größte) Modell ein AR (2). Schätzen Sie dieses Modell global, dh für die kombinierten Zeitreihen. Vergleichen Sie die Fehlersumme der Quadrate für die kombinierte Menge mit der Summe der beiden einzelnen Fehlersummen der Quadrate, um einen F-Wert zu generieren und die Hypothese konstanter Parameter über Gruppen hinweg zu testen. Ich wünschte, Sie könnten Ihre Daten posten und ich werde diesen Test genau veranschaulichen.

ZUSÄTZLICHE KOMMENTARE:

Da der Datensatz automatisch korreliert ist, gilt die Normalität nicht. Wenn die Beobachtungen über die Zeit unabhängig sind, kann man einige der bekannten Nicht-Zeitreihenmethoden anwenden. In Bezug auf Ihre Anfrage nach einem einfach zu lesenden Buch über Zeitreihen schlage ich den Wei-Text von Addison-Wesley vor. Sozialwissenschaftler werden feststellen, dass der nicht-mathematische Ansatz von Mcleary und Hay (1980) intuitiver, aber nicht konsequent genug ist.

IrishStat
quelle
1
Dies scheint die grundlegenden Probleme nicht wirklich anzugehen. (1) Warum ist ein solches Modell angemessen? (2) Warum sollte jede Maus modelliert werden und nicht etwa das mittlere Populationsgewicht oder die Gewichtszunahme? (3) Warum ist eine Prüfung konstanter Parameter relevant? Die Frage bittet um einen einseitigen Test. Die meisten der von Ihnen genannten Parameter scheinen weder wissenschaftlich relevant zu sein, noch quantifizieren sie direkt das Gefühl, dass ein Diagramm durchgehend über dem anderen liegt. (4) Wie kontrollieren Sie zu Beginn des Experiments mögliche Unterschiede in den Eigenschaften der beiden Populationen?
whuber
: whuber Der Test für die Konstanz der Parameter ist relevant, da Sie einen Koeffizientensatz für die erste Lesegruppe von Haus 1 und einen zweiten Koeffizientensatz für die zweite Maus haben. Die Frage lautet: "Gibt es kollektiv einen signifikanten Unterschied zwischen den Koeffizienten?". da einer der Modellkoeffizienten eine Konstante sein könnte und wenn dies der Fall ist, könnte der Unterschied zwischen den Koeffizienten darauf zurückzuführen sein, dass die Konstanten statistisch voneinander verschieden sind.
IrishStat
1
Ich denke, Sie haben teilweise Recht, aber Sie müssen Ihre Charakterisierung des Problems verfeinern. Viele der ARIMA-Koeffizienten sind möglicherweise wissenschaftlich irrelevant. Wenn zum Beispiel einer von ihnen im Laufe der Zeit wie ein quadratischer Term wirkt, kann ein Unterschied etwas über die Form der Wachstumskurven aussagen, aber das kann wenig nützen. Wenn man Koeffizienten wählt, um die experimentellen Endpunkte widerzuspiegeln, und nur diese testet , könnte dadurch etwas Gutes erreicht werden. Im Allgemeinen führen Zeitreihenmodelle jedoch Koeffizienten ein (z. B. Autokorrelation), die hier wahrscheinlich nicht von direktem wissenschaftlichem Interesse sind.
whuber
whuber: "Wenn man Koeffizienten auswählt, um die experimentellen Endpunkte wiederzugeben, und nur diese testet, könnte etwas Gutes dadurch erreicht werden", macht es für mich keinen Sinn, die Zwischenpunkte zu ignorieren. Im Gegensatz zu Ihrem Kommentar sind der Zeitreihenmodus und die zugehörigen Koeffizienten von erheblichem wissenschaftlichem Interesse, da er die Verteilung von Messwerten charakterisiert und in einen zufälligen Prozess (den Fehlerterm) umwandelt, der frei von autokorrelativen Strukturen und anschließend für Tests geeignet ist Normalität erfordern. Der Test, den ich vorschlage, setzt voraus, dass diese Annahme zutrifft.
IrishStat
1
Autokorrelation kann hier von geringer Bedeutung sein. Das Interesse richtet sich explizit auf die Trends: Wie unterscheiden sich die zugrunde liegenden Wachstumskurven zwischen den beiden Populationen? Autokorrelationsparameter sind Störparameter, die nur insoweit eingeführt und behandelt werden müssen, als sie dazu beitragen können, die Schätzung dieser Wachstumskurven zu verbessern. Die erste Priorität besteht darin, ein wissenschaftliches Modell des Wachstums zu übernehmen, dieses Modell mit interpretierbaren und interessanten Parametern darzustellen und diese zu schätzen . Eine automatische Anwendung von Zeitreihentechniken wird dies wahrscheinlich nicht erreichen.
whuber