Ich habe einige kumulative Frequenzdaten. Eine Linie passt sehr gut zu den Daten, aber es gibt ein zyklisches / periodisches Wackeln in der Linie. Ich möchte schätzen , wenn die kumulative Frequenz einen bestimmten Wert erreichen wird c . Wenn ich die Residuen gegen angepasste Werte zeichne, erhalte ich ein schönes sinusförmiges Verhalten.
Um eine weitere Komplikation hinzuzufügen, beachten Sie, dass in den Residuendiagrammen
Es gibt zwei Zyklen mit niedrigeren Werten als die anderen, was einen Wochenendeffekt darstellt, der ebenfalls berücksichtigt werden muss.
Also, wohin gehe ich von hier aus? Wie kann ich einen Cosinus, Sinus oder einen zyklischen Term zu einem Regressionsmodell zu ca. Schätzung, wann die kumulative Häufigkeit gleich ?
quelle
Beginnen wir mit der Beobachtung, dass gewöhnliche kleinste Quadrate, die für diese Daten geeignet sind, wahrscheinlich unangemessen sind. Wenn die einzelnen Daten, die akkumuliert werden, wie üblich zufällige Fehlerkomponenten aufweisen, ist der Fehler in den kumulativen Daten ( nicht die kumulativen Häufigkeiten - das ist etwas anderes als das, was Sie haben) die kumulative Summe aller Fehlerausdrücke. Dies macht die kumulativen Daten heteroskedastisch (sie werden mit der Zeit immer variabler) und stark positiv korreliert. Da sich diese Daten so regelmäßig verhalten und es so viele gibt, gibt es kein Problem mit der Anpassung Sie erhalten, aber Ihre Schätzungen der Fehler, Ihre Vorhersagen (worum es bei der Frage geht) und insbesondere Ihre Standardvorhersagefehler können weit entfernt sein.
Ein Standardverfahren zur Analyse solcher Daten beginnt mit den ursprünglichen Werten. Nehmen Sie die täglichen Unterschiede, um die höherfrequente sinusförmige Komponente zu entfernen. Nehmen Sie die wöchentlichen Unterschiede von denen, um einen möglichen Zyklus von Woche zu Woche zu entfernen. Analysieren Sie, was noch übrig ist. Die ARIMA- Modellierung ist ein leistungsstarker, flexibler Ansatz. Beginnen Sie jedoch einfach: Zeichnen Sie die differenzierten Daten, um zu sehen, was los ist, und fahren Sie dann fort. Beachten Sie auch, dass Ihre Schätzungen für den Wochenzyklus mit weniger als zwei Datenwochen schlecht sind und diese Unsicherheit die Unsicherheit in den Vorhersagen dominieren wird.
quelle
Offensichtlich hat die dominante Schwingung eine Periode von einem Tag. Anscheinend gibt es auch Komponenten mit niedrigeren Frequenzen, die sich auf den Wochentag beziehen. Fügen Sie also eine Komponente mit einer Frequenz von einer Woche (dh einem Siebtel eines Tages) und den ersten Harmonischen hinzu. Das ergibt ein Modell der Form:
quelle
Warum nicht einfach einen GA verwenden, um die Amplitude, Periode und Phase einer Sinus- (oder Cosinus-) Reihe nacheinander zu finden und dann zu kombinieren? Optimieren Sie Folgendes: (n (n-1) / ((np-1) ^ 2 (np-2))) RSS
quelle