Ist es gültig, eine Zeitreihe zu aggregieren, damit sie aussagekräftiger aussieht?

10

Noch eine Frage zu Zeitreihen von mir.

Ich habe einen Datensatz, der täglich Aufzeichnungen über gewalttätige Vorfälle in einer psychiatrischen Klinik über drei Jahre enthält. Mit Hilfe meiner vorherigen Frage habe ich daran herumgespielt und bin jetzt ein bisschen glücklicher darüber.

Das, was ich jetzt habe, ist, dass die tägliche Serie sehr laut ist. Es schwankt wild auf und ab, von 0 zu Zeiten bis zu 20. Mit Lössplots und dem Prognosepaket (das ich Anfängern wie mir sehr empfehlen kann) erhalte ich nur eine völlig flache Linie mit massiven Konfidenzintervallen aus der Prognose.

Die wöchentliche oder monatliche Zusammenfassung der Daten ist jedoch viel sinnvoller. Sie kehren vom Beginn der Serie an nach unten und nehmen dann in der Mitte wieder zu. Lössplot und das Prognosepaket ergeben beide etwas, das viel aussagekräftiger aussieht.

Es fühlt sich allerdings ein bisschen nach Betrug an. Bevorzuge ich nur die aggregierten Versionen, weil sie ohne wirkliche Gültigkeit gut aussehen?

Oder wäre es besser, einen gleitenden Durchschnitt zu berechnen und diesen als Grundlage zu verwenden? Ich fürchte, ich verstehe die Theorie dahinter nicht gut genug, um zuversichtlich zu sein, was akzeptabel ist

Chris Beeley
quelle

Antworten:

8

Dies hängt ganz von Ihrer Zeitreihe ab und davon, welchen Effekt Sie entdecken / beweisen möchten usw.

Eine wichtige Sache hier ist, welche Art von Zeiträumen Sie in Ihren Daten haben. Machen Sie ein Spektrum Ihrer Daten und sehen Sie, welche Frequenzen in Ihren Daten gemeinsam sind.

Auf jeden Fall lügen Sie nicht, wenn Sie sich entscheiden, aggregierte Werte anzuzeigen. Wenn Sie nach Effekten suchen, die über Wochen auftreten (z. B. mehr Gewalt im Sommer bei heißem Wetter), ist dies das Richtige.

Vielleicht können Sie sich auch die Hilbert Huang Transformation ansehen. Auf diese Weise erhalten Sie Funktionen für den Eigenmodus, die für visuelle Analysen sehr praktisch sind.

Peter Smit
quelle
12

Bei Prognosen werden häufig Daten aggregiert, um das Signal / Rausch-Verhältnis zu erhöhen. Es gibt beispielsweise mehrere Artikel über die Auswirkung der zeitlichen Aggregation auf die Prognosegenauigkeit in der Wirtschaft. Was Sie wahrscheinlich in den täglichen Daten sehen, ist ein schwaches Signal, das von Rauschen überschwemmt wird, während die wöchentlichen und monatlichen Daten ein stärkeres Signal zeigen, das besser sichtbar ist.

Ob Sie die zeitliche Aggregation verwenden möchten, hängt ganz von Ihrem Zweck ab. Wenn Sie Prognosen für tägliche Vorfälle benötigen, ist die Aggregation nicht sehr nützlich. Wenn Sie daran interessiert sind, die Auswirkungen mehrerer Kovariaten auf die Inzidenzhäufigkeit zu untersuchen, und alle Ihre Daten täglich verfügbar sind, würde ich wahrscheinlich die täglichen Daten verwenden, da dies eine größere Stichprobe ergibt und Sie wahrscheinlich in die Lage versetzt, diese zu erkennen die Effekte leichter.

Da Sie das Prognosepaket verwenden, sind Sie vermutlich an Zeitreihenprognosen interessiert. Benötigen Sie also tägliche Prognosen, wöchentliche Prognosen oder monatliche Prognosen? Die Antwort bestimmt, ob die Aggregation für Sie geeignet ist.

Rob Hyndman
quelle
1

Das Problem (Dilemma), mit dem Sie konfrontiert sind, scheint darin zu bestehen, ein optimales (oder anderweitig gutes) Stichprobenintervall für die Überarbeitung Ihrer Prognosen auszuwählen. Sehen Sie sich zunächst den Linktext von Browns berühmtem Buch an, der auch als gute Referenz gelten würde. Alles läuft darauf hinaus, "das Risiko, eine Änderung nicht schnell zu bemerken, gegen die inhärente Variabilität der Daten und die Kosten für die häufige Überarbeitung von Plänen abzuwägen". Wenn Sie nicht bereit sind, Ihre Prognose (und die Entscheidungen, die sie motiviert haben) täglich zu überarbeiten, müssen Sie die (lautesten) täglichen Daten nicht wirklich verwenden. Ein wichtiger Punkt, der in der zeitgenössischen Prognoseliteratur häufig verloren geht, ist, dass Prognosen nur zur Entscheidungsfindung erforderlich sind (es sei denn, man weiß auch, wie man daraus Spaß macht).

Winterschlaf
quelle