Ich habe einen Zeitreihendatensatz (tägliche Häufigkeit), der den Verkauf eines Produkts an einen Kunden im Laufe der Zeit darstellt. Der Umsatz wird wie folgt dargestellt:
wobei jede Zahl den Verkauf des Produkts an einem Tag darstellt.
Das Problem ist, dass Zeitreihen-Prognosemethoden (ARMA, HoltWinters) für "kontinuierliche" und "glatte" Daten gut funktionieren, in diesem Fall jedoch keine guten Ergebnisse liefern.
Ich möchte eine Prognose dieser Reihe unter Berücksichtigung von zwei Punkten erstellen: (1) Sicherstellung nicht negativer Werte und (2) spärliche / nicht kontinuierliche Daten. Weiß jemand, wie man dieses Problem angeht? Welche Methoden / Techniken?
Vielen Dank!
time-series
forecast
Bernardo Aflalo
quelle
quelle
Antworten:
Ich habe hier zwei Ideen, vielleicht sind sie hilfreich.
Idee 1: Modellzeit zwischen Ereignissen
Sie können sich vorstellen, dass Ihre Daten durch zwei Prozesse generiert werden: Der erste ist eine Verteilung über Zeitintervalle und der zweite ist eine Verteilung über Kaufbeträge. Um Ihre Daten zu modellieren, können Sie eine Verteilung (Gauß?) Über die Werte ungleich Null in Ihrem Datensatz und eine andere über die Länge der Folgen von Nullen (Poisson?) Erstellen.
Idee 2: Modell Kundeninventar
Obwohl die Verkaufsereignisse in Ihrem Datensatz spärlich sind, können Sie ein wenig Zeit damit verbringen, ein Modell zu erstellen, warum der Kunde Einkäufe tätigt, wenn er dies tut. In einem möglichen Modell hat der Kunde einen Bestand, der mit der Zeit schrumpft, und er kauft ein, wenn sein Bestand einen Mindestschwellenwert überschreitet. Sie können Ihre Verkaufsdaten verwenden, um die Steigung (für lineares Schrumpfen) oder die Rate (für exponentielles Schrumpfen) sowie den Schwellenwert anzupassen.
Dies kann beliebig komplex werden, da der Kunde unter diesem Modell zu unterschiedlichen Zeiten unterschiedliche Schwellenwerte oder Schrumpfungsraten haben kann. Für den Anfang könnte es jedoch ein nützlicher Ansatz sein, sich ein Bild von den Dingen zu machen.
quelle
Bei dieser Art von Daten stammen die Informationen von zwei Stellen
Ähnlich wie bei einer früheren Antwort empfehle ich, zunächst das Zeitintervall auf mögliche Muster zu überprüfen. Zweitens ist die Beziehung zwischen der Höhe des Umsatzes zu überprüfenY.ich mit Y.i - 1 und T.ich , T.i - 1 . Im allgemeinsten Fall sollten diese 2 korreliert werden. Auf dieser Grundlage können Sie entscheiden, ob Sie sie unabhängig oder gemeinsam modellieren möchten. Ein häufig verwendetes Modell ist das Zustandsraummodell. Die Grundidee dabei ist, die spärlichen ts in Unterkomponenten zu zerlegen, die nicht spärlich und für die Modellierung einfacher sind.
Ein allgemeines Modell könnte sein:
quelle