Ich habe eine binäre Zeitreihe: Wir haben 2160 Daten (0 = nicht passiert, 1 = passiert) für einen Zeitraum von einer Stunde in 90 Tagen.
Ich möchte nach diesen 90 Tagen prognostizieren, wo die nächste 1 stattfinden wird, und diese Bestimmung auch für den nächsten Monat verlängern.
time-series
binary-data
amin abdolahnejad
quelle
quelle
Antworten:
quelle
Das einfachste Modell wäre die lineare Regression. Sie können Ihre Daten mit ggplot zeichnen:
Dies ist das einfachste Modell. Es gibt andere nichtlineare Modelle, die möglicherweise besser zu Ihren Daten passen. Denken Sie auch daran, dass Sie möglicherweise das Datumsprotokoll verwenden müssen, um eine bessere Passform zu erzielen. Über nichtlineare Regressionen wie die Polynomregression können Sie hier viel lesen
Jetzt wäre eine zusätzliche Analyse erforderlich, es ist jedoch wichtig festzustellen, ob Ihre Ereignisse unabhängig sind. Es ist möglich, dass es eine Art verwirrende Variable gibt, die Sie möglicherweise nicht berücksichtigen. Sie könnten lineare Regression in Bayesian aussehen sollen (da Sie mehr Dimensionen als nur Zeit und Ja / Nein - Werte zu erhalten) hier
quelle
Unfalldaten? Ich würde zunächst davon ausgehen, dass es stündliche Saisonalität und tägliche Saisonalität gibt. Ohne die Art des Unfalls zu kennen, kann es sein, dass Sie sich das stündliche Pooling von Montag bis Freitag ansehen und das stündliche Pooling für Samstag und Sonntag getrennt durchführen können, sodass Sie 3 Pools von Stunden haben, 24 (Mo-Fr), 24 (Sa) und 24 (So).
Eine weitere Datenreduktion ist möglicherweise möglich, aber unter der Annahme, dass dies nicht der Fall ist, nehmen Sie einfach die Durchschnittswerte. Beispielsweise könnte der Durchschnitt für Sonntag, 15 Uhr, 0,3 betragen (30% Unfallwahrscheinlichkeit). Der Durchschnitt für 16 Uhr könnte 0,2 sein und so weiter.
Die Wahrscheinlichkeit, dass zwischen 15 und 16 Uhr kein Unfall auftritt, wäre (1 - 0,3) (1 - 0,2) = 0,56, sodass die Wahrscheinlichkeit, in diesen zwei Stunden einen Unfall zu haben, 0,44 beträgt und so weiter.
Dies scheint ein guter, einfacher Ausgangspunkt zu sein.
quelle