Gibt es eine gute Möglichkeit, die Glätte einer Zeitreihe in R zu messen? Beispielsweise,
-1, -0.8, -0.6, -0.4, -0.2, 0, 0.2, 0.4, 0.6, 0.8, 1.0
ist viel glatter als
-1, 0.8, -0.6, 0.4, -0.2, 0, 0.2, -0.4, 0.6, -0.8, 1.0
obwohl sie den gleichen Mittelwert und die gleiche Standardabweichung haben. Es wäre cool, wenn es eine Funktion gäbe, mit der ich über eine Zeitreihe hinweg einen reibungslosen Score erzielen könnte.
r
time-series
agmao
quelle
quelle
Antworten:
Die Standardabweichung der Differenzen gibt Ihnen eine grobe Schätzung der Glätte:
Update: Wie Cyan hervorhebt, erhalten Sie ein maßstabsabhängiges Maß. Ein ähnliches skalenunabhängiges Maß würde den Variationskoeffizienten anstelle der Standardabweichung verwenden:
In beiden Fällen entsprechen kleine Werte glatteren Reihen.
quelle
diff
in die Nenner zu kommen? Die Werte würden sich algebraisch reduzieren,(x[n]-x[1])/(n-1)
was ein (grobes) Maß für den Trend ist, und müssten in vielen Fällen extrem nahe bei Null liegen, was zu einer instabilen und nicht fürchterlich aussagekräftigen Statistik führen würde. Ich bin verwirrt, aber vielleicht übersehen ich etwas Offensichtliches ...diff
Annahme der Stationarität vermieden. Wenn es mit dem Nenner definiert wurde,abs(mean(x))
würde die Skalierung nur funktionieren, wennx
es stationär war. Diffs zu nehmen bedeutet, dass es auch für stationäre Prozesse mit Differenzen funktioniert. Natürlich können Unterschiede nichtx
stationär sein und dann gibt es immer noch Probleme. Das Skalieren von Zeitreihen ist aus diesem Grund schwierig. Aber ich nehme Ihren Standpunkt zur Stabilität an. Ich denke, um etwas besser zu machen, müsste man etwas wesentlich raffinierteres tun - zum Beispiel mit einem nichtparametrischen Glätter.Die Autokorrelation nach eins dient als Punktzahl und ist auch statistisch relativ einfach zu interpretieren.
Partiturinterpretation:
quelle
Sie könnten einfach die Korrelation mit der Zeitschrittzahl vergleichen. Dies wäre gleichbedeutend mit der Annahme des R² einer einfachen linearen Regression für die Zeitreihen. Beachten Sie jedoch, dass dies zwei sehr unterschiedliche Zeitreihen sind, sodass ich nicht weiß, wie gut das als Vergleich funktioniert.
quelle