Ich arbeite derzeit an einer Bedarfsprognose mit Daten zu Zehntausenden von Produkten in ein paar Tausend Filialen. Insbesondere habe ich in jedem Geschäft tägliche Verkaufsdaten für ein paar Jahre pro Produkt. Mein Ziel ist es, die zukünftigen Verkäufe jedes Artikels in jedem Geschäft einen Tag im Voraus vorherzusagen. dann zwei Tage voraus usw.
Bisher habe ich überlegt, jedes Produkt-Laden-Paar in eine einzelne Zeitreihe zu unterteilen und für jede Zeitreihe eine Prognose zu erstellen, wie in Neal Wagners Artikel Intelligente Techniken zur Vorhersage mehrerer Zeitreihen in realen Systemen beschrieben . Mit anderen Worten, ich werde nur die historischen Informationen über die Verkäufe des Produkts in einem bestimmten Geschäft verwenden, um die zukünftigen Verkäufe dieses Produkts in diesem Geschäft vorherzusagen.
Ich habe jedoch Kaggle durchsucht und Wettbewerbe wie Corporación Favorita Grocery Sales Forecasting schlagen einen anderen Ansatz vor, bei dem die Informationen aus allen Geschäften und allen Produkten verwendet werden, um zukünftige Verkäufe vorherzusagen. Soweit ich weiß, werden historische Verkaufsinformationen aller Produkte in allen Filialen in den Schulungssatz übernommen, aus dem das Modell lernen wird, zukünftige Verkäufe vorherzusagen. Es unterscheidet sich sehr von herkömmlichen Zeitreihenmethoden, aber anscheinend funktioniert es basierend auf den Ergebnissen des Wettbewerbs.
Die letztere Methode erscheint vielversprechend und robuster. Es besteht jedoch das Problem, Hunderte Millionen Datenpunkte verarbeiten zu müssen.
Welche Methode passt besser zu meiner Aufgabe? Welche Methode würden Sie denjenigen empfehlen, die an ähnlichen Problemen gearbeitet haben?
Antworten:
Ich würde den Ansatz von Neal et al. Nicht empfehlen . . Ihre Daten sind aus zwei Gründen eindeutig:
Sie arbeiten mit Lebensmitteldaten, die normalerweise dichter und stabiler sind als andere Daten von Einzelhandelsprodukten. Ein bestimmter Standort verkauft Dutzende von Milchkartons oder Eierpackungen pro Woche und verkauft seit Jahrzehnten dieselben Produkte im Vergleich zu Mode- oder Autoteilen, bei denen es nicht ungewöhnlich ist, alle 3 oder 4 Wochen einen einzigen Artikel zu verkaufen. und Daten, die nur für ein oder zwei Jahre verfügbar sind.
Sie prognostizieren für Lagerhäuser, nicht für Geschäfte. Ein einzelnes Lager umfasst mehrere Filialen, sodass deren Daten noch dichter als der Durchschnitt sind. Tatsächlich wird ein Lager normalerweise als natürliche Aggregations- / Gruppierungsebene für Geschäfte verwendet, sodass diese bereits im Wesentlichen eine Gruppierung von Geschäftsdaten durchführen.
Aufgrund der Art ihrer Daten können sie einzelne Zeitreihen direkt modellieren. Die Daten der meisten Einzelhändler wären jedoch auf der Ebene der einzelnen Skus / Geschäfte zu spärlich, als dass sie dies erreichen könnten.
Wie zbicyclist sagte, wird dieses Problem normalerweise mithilfe hierarchischer oder mehrstufiger Prognosen angegangen . Kommerzielle Nachfrageprognosepakete verwenden alle eine Form der hierarchischen Prognose
Die Idee ist, Produkte und Geschäfte in ähnliche Produkte und Regionen zu gruppieren, für die aggregierte Prognosen erstellt und zur Bestimmung der Gesamtsaisonalität und des Trends verwendet werden. Diese werden dann unter Verwendung eines Top-Down-Ansatzes mit den für jede einzelne SKU generierten Basisprognosen abgestimmt / Ladenkombination.
Neben der erwähnten Herausforderung besteht ein größeres Problem darin, dass das Finden der optimalen Gruppierungen von Produkten und Geschäften keine triviale Aufgabe ist, die eine Kombination aus Fachwissen und empirischer Analyse erfordert. Produkte und Geschäfte werden normalerweise in ausgeklügelten Hierarchien zusammengefasst (nach Abteilung, Lieferant, Marke usw. für Produkte, nach Region, Klima, Lager usw. für den Standort), die dann zusammen mit den historischen Verkäufen dem Prognosealgorithmus zugeführt werden Daten selbst.
Adressieren von Merax-Kommentaren
Sie führen die Gruppierung implizit durch, indem sie Geschäft, Element, Familie, Klasse und Cluster als kategoriale Merkmale verwenden.
Drei Punkte dazu:
quelle