Zeitreihenvorhersage mit ARIMA vs LSTM

9

Das Problem, mit dem ich mich befasse, ist die Vorhersage von Zeitreihenwerten. Ich betrachte jeweils eine Zeitreihe und möchte anhand von beispielsweise 15% der Eingabedaten die zukünftigen Werte vorhersagen. Bisher bin ich auf zwei Modelle gestoßen:

  • LSTM (Langzeit-Kurzzeitgedächtnis; eine Klasse wiederkehrender neuronaler Netze)
  • ARIMA

Ich habe beide ausprobiert und einige Artikel darüber gelesen. Jetzt versuche ich ein besseres Gefühl dafür zu bekommen, wie man die beiden vergleicht. Was ich bisher gefunden habe:

  1. LSTM funktioniert besser, wenn wir mit einer großen Datenmenge arbeiten und genügend Trainingsdaten verfügbar sind, während ARIMA für kleinere Datensätze besser ist (ist das richtig?)
  2. ARIMA erfordert eine Reihe von Parametern, (p,q,d)die basierend auf Daten berechnet werden müssen, während LSTM das Einstellen solcher Parameter nicht erfordert. Es gibt jedoch einige Hyperparameter, die wir für LSTM einstellen müssen.

Außer den oben genannten Eigenschaften konnte ich keine anderen Punkte oder Fakten finden, die mir bei der Auswahl des besten Modells helfen könnten. Ich wäre wirklich dankbar, wenn mir jemand helfen könnte, Artikel, Papiere oder andere Dinge zu finden (hatte bisher kein Glück, nur einige allgemeine Meinungen hier und da und nichts, was auf Experimenten basiert.)

Ich muss erwähnen, dass ich mich ursprünglich mit Streaming-Daten befasse. Derzeit verwende ich jedoch NAB-Datensätze, die 50 Datensätze mit einer maximalen Größe von 20.000 Datenpunkten enthalten.

Ahajib
quelle
1
Warum probieren Sie nicht einfach die beiden Modelle für einen Teil Ihrer Daten aus, sehen, welches für die Vorhersage besser geeignet ist, und wählen es aus. Oder verwenden Sie beide Modelle und kombinieren Sie ihre Prognosen. Prognosekombinationen übertreffen häufig die einzelnen Prognosen.
Richard Hardy
@RichardHardy Ich habe das bereits getan und bin mir ihrer Leistung in meinen Datensätzen bewusst. Ich versuche, beide besser zu verstehen, insbesondere ihre Nachteile, um herauszufinden, welcher der beste Kandidat für die bevorstehenden Datenproben sein könnte.
Ahajib
1
DS: Zeitreihenvorhersage mit ARIMA vs LSTM
Franck Dernoncourt
Bitte lesen Sie die Hilfe - insbesondere den vorletzten Absatz mit der Aufschrift " Bitte beachten Sie jedoch, dass Cross-Posting auf SE-Websites nicht empfohlen wird. Wählen Sie einen besten Ort für die Veröffentlichung Ihrer Frage. Später, wenn es sich als besser geeignet erweist." Eine andere Site kann migriert werden. "
Glen_b

Antworten:

2

Ein Vergleich von künstlichen neuronalen Netzen und Zeitreihenmodellen zur Vorhersage von Rohstoffpreisen vergleicht die Leistung von ANN und ARIMA bei der Vorhersage von finanziellen Zeitreihen. Ich denke, es ist ein guter Ausgangspunkt für Ihre Literaturübersicht.

In vielen Fällen übertreffen neuronale Netze AR-basierte Modelle. Ich denke jedoch, dass ein Hauptnachteil (der in der akademischen Literatur nicht so häufig diskutiert wird) bei fortgeschritteneren Methoden des maschinellen Lernens darin besteht, dass sie Black Boxes verwenden. Dies ist ein großes Problem, wenn Sie jemandem erklären müssen, wie das Modell funktioniert, der nicht so viele dieser Modelle kennt (zum Beispiel in einem Unternehmen). Aber wenn Sie diese Analyse nur als Schularbeit durchführen, denke ich nicht, dass dies ein Problem sein wird.

Aber wie der vorherige Kommentator sagte, ist es normalerweise am besten, einen Ensemble-Schätzer zu bilden, in dem Sie zwei oder mehr Modelle kombinieren.

Juha
quelle
7
Der von Ihnen zitierte Verweis befasst sich mit einfachen neuronalen Feedforward-Netzen und ist zu alt, um nützlich zu sein (1990er Jahre sind ein Jahrhundert her). In der OP-Frage wird nach wiederkehrenden neuronalen Netzen mit der LSTM-Architektur gefragt, und dieses Papier behandelt dies nicht.
HoraceT
1
Wie @horaceT bereits erwähnt hat, ist dieses Papier etwas veraltet. Wenn Sie ein neueres Papier vorschlagen könnten, das Informationen zu LSTMs enthält, wäre dies fantastisch. Vielen Dank
Ahajib