Nur eine allgemeine Frage. Wenn Sie Zeitreihendaten haben, wann ist es besser, Zeitreihentechniken (auch bekannt als ARCH, GARCH usw.) gegenüber maschinellen / statistischen Lerntechniken (KNN, Regression) zu verwenden? Wenn es eine ähnliche Frage gibt, die bei crossvalidated vorhanden ist, weisen Sie mich bitte darauf hin - sie haben gesucht und konnten keine finden.
10
Antworten:
Typische Methoden des maschinellen Lernens setzen voraus, dass Ihre Daten unabhängig und identisch verteilt sind, was für Zeitreihendaten nicht gilt. Daher sind sie im Vergleich zu Zeitreihentechniken hinsichtlich der Genauigkeit im Nachteil. Beispiele hierfür finden Sie in den vorherigen Fragen. Die Reihenfolge der Zeitreihen für maschinelles Lernen und zufällige Gesamtstruktur passt zu gut .
quelle
Francis Diebold hat kürzlich "ML and Metrics VI: Ein wesentlicher Unterschied zwischen ML und TS Econometrics" in seinem Blog veröffentlicht. Ich stelle eine verkürzte Version davon zur Verfügung, daher geht ihm der gesamte Kredit zu. (Fettdruck liegt bei mir.)
Die Schlussfolgerung lautet also:
Ich empfehle, den gesamten Originalbeitrag hier zu lesen .
quelle
Wie @Tom Minka betonte, gehen die meisten ML-Techniken von iid-Eingaben aus. Es gibt jedoch einige Lösungen:
Man kann alle vergangenen Zeitreihenproben innerhalb des Systems 'Speicher' als einen Merkmalsvektor verwenden, dh: x = [x (t-1), x (t-2), ... x (tM)]. Dies hat jedoch zwei Probleme: 1) Abhängig von Ihrer Gruppierung haben Sie möglicherweise einen großen Merkmalsvektor. 2 Einige Methoden erfordern, dass Merkmale innerhalb des Merkmalsvektors unabhängig sind, was hier nicht der Fall ist.
Es gibt viele ML-Techniken, die speziell für solche Zeitreihendaten entwickelt wurden, beispielsweise Hidden-Markov-Modelle, die sehr erfolgreich zur Erkennung von Anfällen, zur Sprachverarbeitung usw. eingesetzt wurden.
Schließlich habe ich einen Ansatz gewählt, um mithilfe von Techniken zur Merkmalsextraktion ein dynamisches Regressionsproblem (das das Zeitelement enthält) in ein statisches Problem umzuwandeln. Beispielsweise ordnet der PDM-Ansatz (Principal Dynamics Mode) den eingegebenen Merkmalsvektor ([x (t-1), x (t-2), ... x (tM)]) einem statischen ([v ()) zu). 1), v (2), .. v (L)]) durch Faltung der Vergangenheit mit einer systemspezifischen linearen Filterbank (PDMs), siehe Marmarelis, 2004, Buch oder Marmarelis, Vasilis Z. "Modellierungsmethode für nichtlineare physiologische Systeme . " Annals of Biomedical Engineering 25.2 (1997): 239-251 ...
quelle