Welche zeitliche Auflösung für den Zeitreihen-Signifikanztest?

9

Ich benötige eine Anleitung zum geeigneten Pooling-Level, um Mittelwerttests für Zeitreihendaten durchführen zu können. Ich bin besorgt über die zeitliche und opfernde Pseudo-Replikation, die bei dieser Anwendung unter Spannung zu stehen scheint. Dies bezieht sich eher auf eine Mensurstudie als auf ein manipulatives Experiment.

Betrachten Sie eine Überwachungsübung : Ein Sensorsystem misst den Gehalt an gelöstem Sauerstoff (DO) an vielen Stellen über die Breite und Tiefe eines Teichs. Die Messungen für jeden Sensor werden zweimal täglich aufgezeichnet, da bekannt ist, dass der Sauerstoffgehalt täglich variiert. Die beiden Werte werden gemittelt, um einen Tageswert aufzuzeichnen. Einmal pro Woche werden die täglichen Ergebnisse räumlich aggregiert, um eine einzige wöchentliche Sauerstoffkonzentration für den gesamten Teich zu erhalten.

Diese wöchentlichen Ergebnisse werden regelmäßig gemeldet und weiter aggregiert - die wöchentlichen Ergebnisse werden gemittelt, um eine monatliche DO-Konzentration für den Teich zu erhalten. Die monatlichen Ergebnisse werden gemittelt, um einen jährlichen Wert zu erhalten. Die Jahresdurchschnitte werden selbst gemittelt, um dekadische Sauerstoffkonzentrationen für den Teich anzugeben.

Ziel ist es, Fragen zu beantworten wie: War die DO-Konzentration des Teichs im Jahr X höher, niedriger oder gleich der Konzentration im Jahr Y? Unterscheidet sich die durchschnittliche Sauerstoffkonzentration der letzten zehn Jahre von der des letzten Jahrzehnts? Die Sauerstoffkonzentrationen in einem Teich reagieren auf viele Eingaben von großer Größe und variieren daher erheblich. Ein Signifikanztest ist erforderlich. Die Methode besteht darin, einen T-Test-Vergleich der Mittelwerte zu verwenden. Angesichts der Tatsache, dass die dekadischen Werte der Mittelwert der Jahreswerte und die Jahreswerte der Mittelwert der monatlichen Werte sind, erscheint dies angemessen.

Hier ist die Frage : Sie können die dekadischen Mittelwerte und die T-Werte dieser Mittelwerte aus den monatlichen DO-Werten oder aus den jährlichen DO-Werten berechnen. Der Mittelwert ändert sich natürlich nicht, aber die Breite des Konfidenzintervalls und der T-Wert. Aufgrund der Größenordnung eines höheren N, das durch die Verwendung monatlicher Werte erreicht wird, wird der CI häufig erheblich enger, wenn Sie diesen Weg gehen. Dies kann die gegenteilige Schlussfolgerung gegenüber der Verwendung der Jahreswerte in Bezug auf die statistische Signifikanz eines beobachteten Mittelwertunterschieds unter Verwendung desselben Tests mit denselben Daten ziehen. Was ist die richtige Interpretation dieser Diskrepanz?

Wenn Sie die monatlichen Ergebnisse verwenden, um die Teststatistiken für einen Unterschied in den dekadischen Mitteln zu berechnen, haben Sie Probleme mit der zeitlichen Pseudoreplikation? Wenn Sie die Jahresergebnisse zur Berechnung der Dekadentests verwenden, opfern Sie dann Informationen und damit Pseudoreplikationen?


quelle
Ihre Frage ist ziemlich knifflig ... Ich denke darüber nach.
deps_stats

Antworten:

1

Ich glaube, dass Sie versuchen, statistische Methoden zu verwenden, die für unabhängige Beobachtungen geeignet sind, während Sie Daten sowohl vorübergehend als auch räumlich korreliert haben. Wenn Sie Beobachtungen für 5 Stunden haben und sich dazu entschließen, dies als 241 Beobachtungen pro Minute wiederzugeben, haben Sie wirklich keine 240 Freiheitsgrade in Bezug auf den Mittelwert dieser 241 Werte. Die Autokorrelation führt möglicherweise zu einer Überbewertung der Größe von "N" und erzeugt somit falsche Unsicherheitsaussagen. Was Sie tun müssen, ist, jemanden / ein Lehrbuch / eine Website / ... zu finden, um Sie über Zeitreihendaten und deren Analyse zu unterrichten. Eine Möglichkeit, um zu beginnen, besteht darin, "mir zu helfen, Zeitreihen zu verstehen" und mit dem Lesen / Lernen zu beginnen. Im Internet ist viel Material verfügbar.http://www.autobox.com/AFSUniversity/afsuFrameset.htm . Ich erwähne dies, da ich immer noch mit dieser Firma und ihren Produkten verbunden bin. Daher sind meine Kommentare "voreingenommen und eigensinnig", aber nicht nur eigennützig.

IrishStat
quelle