Ich habe zwei Zeitreihen, die in der folgenden Darstellung gezeigt werden:
Der Plot zeigt die vollständigen Details beider Zeitreihen, aber ich kann ihn bei Bedarf leicht auf die zufälligen Beobachtungen reduzieren.
Meine Frage ist: Mit welchen statistischen Methoden kann ich die Unterschiede zwischen den Zeitreihen bewerten?
Ich weiß, dass dies eine ziemlich breite und vage Frage ist, aber ich kann anscheinend nirgendwo viel einführendes Material dazu finden. Aus meiner Sicht sind zwei Dinge zu bewerten:
1. Sind die Werte gleich?
2. Sind die Trends gleich?
Welche Art von statistischen Tests würden Sie vorschlagen, um diese Fragen zu bewerten? Zu Frage 1 kann ich natürlich die Mittelwerte der verschiedenen Datensätze beurteilen und nach signifikanten Unterschieden bei den Verteilungen suchen. Gibt es dafür eine Möglichkeit, die den Zeitreihencharakter der Daten berücksichtigt?
Zu Frage 2 - Gibt es so etwas wie die Mann-Kendall-Tests, bei denen nach Ähnlichkeiten zwischen zwei Trends gesucht wird? Ich könnte den Mann-Kendall-Test für beide Datensätze durchführen und vergleichen, aber ich weiß nicht, ob dies eine gültige Methode ist oder ob es eine bessere Methode gibt.
Ich mache das alles in R, wenn Sie also vorschlagen, ein R-Paket zu haben, lassen Sie es mich bitte wissen.
quelle
Antworten:
Wie andere angegeben haben, müssen Sie eine gemeinsame Messfrequenz haben (dh die Zeit zwischen den Beobachtungen). Damit würde ich ein gemeinsames Modell identifizieren, das jede Serie angemessenerweise separat beschreibt. Dies kann ein ARIMA-Modell oder ein Regressionsmodell mit multiplizierten Trends und möglichen Pegelverschiebungen sein oder ein zusammengesetztes Modell, das sowohl Speicher- (ARIMA) als auch Dummy-Variablen integriert. Dieses gemeinsame Modell könnte global und separat für jede der beiden Reihen geschätzt werden, und dann könnte man einen F-Test erstellen, um die Hypothese eines gemeinsamen Parametersatzes zu testen.
quelle
Betrachten Sie die
grangertest()
in der lmtest- Bibliothek.Es ist ein Test, um festzustellen, ob eine Zeitreihe für die Vorhersage einer anderen Zeitreihe hilfreich ist.
Ein paar Hinweise zum Einstieg:
https://spia.uga.edu/faculty_pages/monogan/teaching/ts/
https://spia.uga.edu/faculty_pages/monogan/teaching/ts/Kgranger.pdf
http://en.wikipedia.org/wiki/Granger_causality
quelle
Bin gerade darauf gestoßen. Ihre erste Antwort: Zeichnen Sie die beiden Sätze auf den gleichen Maßstab (zeitlich), um die Unterschiede visuell zu erkennen. Sie haben dies getan und sehen leicht, dass es einige offensichtliche Unterschiede gibt. Der nächste Schritt ist die Verwendung einer einfachen Korrelationsanalyse ... und zu sehen, wie gut sie mit dem Korrelationskoeffizienten (r) zusammenhängen. Wenn das r klein ist, wäre Ihre Schlussfolgerung, dass sie schwach verwandt sind und daher keine wünschenswerten Vergleiche und ein größerer Wert, wenn r gute Vergleiche s zwischen den beiden Reihen nahelegen würde. Der dritte Schritt, bei dem eine gute Korrelation besteht, besteht darin, die statistische Signifikanz von r zu testen. Hier können Sie den Shapiro-Welch-Test verwenden, bei dem davon ausgegangen wird, dass die beiden Reihen normalverteilt sind (Nullhypothese) oder nicht (Alternativhypothese). Es gibt andere Tests, die Sie durchführen können, aber ich hoffe, dass meine Antwort hilft.
quelle
Passen Sie mit polyfit eine gerade Linie an beide Zeitreihensignale an. Berechnen Sie dann den quadratischen Mittelwertfehler (RMSE) für beide Linien. Der erhaltene Wert für die rote Linie wäre wesentlich geringer als der für die graue Linie.
Machen Sie auch die Messwerte auf einer gemeinsamen Frequenz.
quelle