Das Problem, mit dem ich mich befasse, ist die Vorhersage von Zeitreihenwerten. Ich betrachte jeweils eine Zeitreihe und möchte anhand von beispielsweise 15% der Eingabedaten die zukünftigen Werte vorhersagen. Bisher bin ich auf zwei Modelle gestoßen:
Ich habe beide ausprobiert und einige Artikel darüber gelesen. Jetzt versuche ich ein besseres Gefühl dafür zu bekommen, wie man die beiden vergleicht. Was ich bisher gefunden habe:
- LSTM funktioniert besser, wenn wir mit einer großen Datenmenge arbeiten und genügend Trainingsdaten verfügbar sind, während ARIMA für kleinere Datensätze besser ist (ist das richtig?)
- ARIMA erfordert eine Reihe von Parametern,
(p,q,d)
die basierend auf Daten berechnet werden müssen, während LSTM das Einstellen solcher Parameter nicht erfordert. Es gibt jedoch einige Hyperparameter, die wir für LSTM einstellen müssen.
Außer den oben genannten Eigenschaften konnte ich keine anderen Punkte oder Fakten finden, die mir bei der Auswahl des besten Modells helfen könnten. Ich wäre wirklich dankbar, wenn mir jemand helfen könnte, Artikel, Papiere oder andere Dinge zu finden (hatte bisher kein Glück, nur einige allgemeine Meinungen hier und da und nichts, was auf Experimenten basiert.)
Ich muss erwähnen, dass ich mich ursprünglich mit Streaming-Daten befasse. Derzeit verwende ich jedoch NAB-Datensätze, die 50 Datensätze mit einer maximalen Größe von 20.000 Datenpunkten enthalten.
quelle
Antworten:
Ein Vergleich von künstlichen neuronalen Netzen und Zeitreihenmodellen zur Vorhersage von Rohstoffpreisen vergleicht die Leistung von ANN und ARIMA bei der Vorhersage von finanziellen Zeitreihen. Ich denke, es ist ein guter Ausgangspunkt für Ihre Literaturübersicht.
In vielen Fällen übertreffen neuronale Netze AR-basierte Modelle. Ich denke jedoch, dass ein Hauptnachteil (der in der akademischen Literatur nicht so häufig diskutiert wird) bei fortgeschritteneren Methoden des maschinellen Lernens darin besteht, dass sie Black Boxes verwenden. Dies ist ein großes Problem, wenn Sie jemandem erklären müssen, wie das Modell funktioniert, der nicht so viele dieser Modelle kennt (zum Beispiel in einem Unternehmen). Aber wenn Sie diese Analyse nur als Schularbeit durchführen, denke ich nicht, dass dies ein Problem sein wird.
Aber wie der vorherige Kommentator sagte, ist es normalerweise am besten, einen Ensemble-Schätzer zu bilden, in dem Sie zwei oder mehr Modelle kombinieren.
quelle