Wenn wir über lange Zeitreihen mit hoher Auflösung und viel Rauschen verfügen, ist es oft sinnvoll, die Daten zu einer niedrigeren Auflösung zu aggregieren (z. B. tägliche bis monatliche Werte), um ein besseres Verständnis der Vorgänge zu erhalten und einige davon effektiv zu entfernen der Lärm.
Ich habe mindestens eine Veröffentlichung gesehen, in der dann einige Statistiken auf die aggregierten Daten angewendet werden, einschließlich eines für eine lineare Regression für eine separate Variable. Ist das gültig Ich hätte gedacht, dass der Mittelungsprozess das Ergebnis aufgrund des reduzierten Rauschens ein wenig verändern würde.
Können einige Statistiken im Allgemeinen auf aggregierte Zeitreihendaten angewendet werden, andere nicht? Wenn ja, welche? Vielleicht eine lineare Kombination?
quelle
Antworten:
Ich denke, die Frage in der Überschrift ist zu weit gefasst, um sinnvoll beantwortet zu werden, zumal es wahrscheinlich sowohl auf die Aggregationsmethode als auch auf die fragliche Statistik ankommt.
Dies gilt sogar für den Mittelwert: Versuchen Sie, die Signalform und -intensität beizubehalten (z. B. Savitzky-Golay-Filter), oder versuchen Sie, den Bereich unter dem Signal beizubehalten (z. B. Löss)?
Lärmbezogene Statistiken sind offensichtlich betroffen: Dies ist normalerweise der Zweck der Aggregation.
Diese Änderung ist höchstwahrscheinlich der Zweck der Aggregation.
Im Allgemeinen dürfen Sie eine Menge Dinge mit Ihren Daten tun, aber das müssen Sie
quelle
mit
In einer Einstellung ohne Regression gibt es Ergebnisse, die zeigen, dass die Aggregation die Eigenschaften der Zeitreihen ändern kann. Wenn Sie beispielsweise AR (1) -Prozesse mit Kurzzeitgedächtnis aggregieren (die Korrelation zwischen zwei Beobachtungen der Zeitreihe verschwindet schnell, wenn der Abstand zwischen ihnen vergrößert wird), können Sie einen Prozess mit Langzeitgedächtnis erhalten.
Zusammenfassend lässt sich also sagen, dass die Gültigkeit der Anwendung von Statistiken auf aggregierte Daten eine statistische Frage ist. Abhängig vom Modell können Sie eine Hypothese erstellen, ob es sich um eine gültige Anwendung handelt oder nicht.
quelle