Zeitreihenanalyse vs. maschinelles Lernen?

10

Nur eine allgemeine Frage. Wenn Sie Zeitreihendaten haben, wann ist es besser, Zeitreihentechniken (auch bekannt als ARCH, GARCH usw.) gegenüber maschinellen / statistischen Lerntechniken (KNN, Regression) zu verwenden? Wenn es eine ähnliche Frage gibt, die bei crossvalidated vorhanden ist, weisen Sie mich bitte darauf hin - sie haben gesucht und konnten keine finden.

Nagy
quelle
1
Relevant: cs.stackexchange.com/questions/13937/…
Anton Tarasenko

Antworten:

9

Typische Methoden des maschinellen Lernens setzen voraus, dass Ihre Daten unabhängig und identisch verteilt sind, was für Zeitreihendaten nicht gilt. Daher sind sie im Vergleich zu Zeitreihentechniken hinsichtlich der Genauigkeit im Nachteil. Beispiele hierfür finden Sie in den vorherigen Fragen. Die Reihenfolge der Zeitreihen für maschinelles Lernen und zufällige Gesamtstruktur passt zu gut .

Tom Minka
quelle
Vielen Dank für Ihre Antwort. Um Ihren Standpunkt zu verdeutlichen, scheint es beim maschinellen Lernen mehr darum zu gehen, Beziehungen in den Daten zu finden, während es bei der Zeitreihenanalyse eher darum geht, die Ursachen der Daten korrekt zu identifizieren - dh wie stochastische Faktoren sie beeinflussen. Stimmst du dem zu?
Nagy
4
Nein, ich würde dieser Zusammenfassung nicht zustimmen.
Tom Minka
4

Francis Diebold hat kürzlich "ML and Metrics VI: Ein wesentlicher Unterschied zwischen ML und TS Econometrics" in seinem Blog veröffentlicht. Ich stelle eine verkürzte Version davon zur Verfügung, daher geht ihm der gesamte Kredit zu. (Fettdruck liegt bei mir.)

[S] tatistisches maschinelles Lernen (ML) und Zeitreihenökonometrie (TS) haben viele Gemeinsamkeiten. Aber es gibt auch einen interessanten Unterschied: Die Betonung von ML auf die flexible nichtparametrische Modellierung der bedingten mittleren Nichtlinearität spielt bei TS keine große Rolle. <...>

[T] Hier gibt es nur sehr wenige Hinweise auf eine wichtige bedingte mittlere Nichtlinearität in der kovarianzstationären (de-trendierten, de-saisonalisierten) Dynamik der meisten wirtschaftlichen Zeitreihen. <...> In der Tat kann ich mir nur eine Art von bedingter mittlerer Nichtlinearität vorstellen, die sich für (zumindest einige) wirtschaftliche Zeitreihen wiederholt als wichtig erwiesen hat: die Markov-Schaltdynamik nach Hamilton-Art.

[Natürlich gibt es einen nichtlinearen Elefanten im Raum: Engle-artige GARCH-Dynamik. Sie sind in der Finanzökonometrie und manchmal auch in der Makroökonometrie von enormer Bedeutung, aber es geht um bedingte Abweichungen, nicht um bedingte Mittel.]

Es gibt also grundsätzlich nur zwei wichtige nichtlineare Modelle in TS, und nur eines davon spricht für die bedingte mittlere Dynamik. Und entscheidend ist, dass beide sehr eng parametrisch sind und eng auf spezielle Merkmale von Wirtschafts- und Finanzdaten zugeschnitten sind.

Die Schlussfolgerung lautet also:

ML betont die Approximation nichtlinearer bedingter Mittelwertfunktionen auf hochflexible nichtparametrische Weise. Das stellt sich bei TS als doppelt unnötig heraus: Es gibt einfach nicht viel Bedingungsmittel-Nichtlinearität, über die man sich Sorgen machen muss, und wenn dies gelegentlich der Fall ist, ist es typischerweise hochspezialisierter Natur, die am besten auf hochspezialisierte (streng parametrische) Weise angenähert wird .

Ich empfehle, den gesamten Originalbeitrag hier zu lesen .

Richard Hardy
quelle
+1. Ich stimme dieser Antwort sehr zu. Typische ML-Methoden zeichnen sich durch nichtparametrische Modellierung aus und haben sehr lockere Annahmen, während ARMA-Modelle "eng parametrisch" sind.
Digio
2

Wie @Tom Minka betonte, gehen die meisten ML-Techniken von iid-Eingaben aus. Es gibt jedoch einige Lösungen:

  1. Man kann alle vergangenen Zeitreihenproben innerhalb des Systems 'Speicher' als einen Merkmalsvektor verwenden, dh: x = [x (t-1), x (t-2), ... x (tM)]. Dies hat jedoch zwei Probleme: 1) Abhängig von Ihrer Gruppierung haben Sie möglicherweise einen großen Merkmalsvektor. 2 Einige Methoden erfordern, dass Merkmale innerhalb des Merkmalsvektors unabhängig sind, was hier nicht der Fall ist.

  2. Es gibt viele ML-Techniken, die speziell für solche Zeitreihendaten entwickelt wurden, beispielsweise Hidden-Markov-Modelle, die sehr erfolgreich zur Erkennung von Anfällen, zur Sprachverarbeitung usw. eingesetzt wurden.

  3. Schließlich habe ich einen Ansatz gewählt, um mithilfe von Techniken zur Merkmalsextraktion ein dynamisches Regressionsproblem (das das Zeitelement enthält) in ein statisches Problem umzuwandeln. Beispielsweise ordnet der PDM-Ansatz (Principal Dynamics Mode) den eingegebenen Merkmalsvektor ([x (t-1), x (t-2), ... x (tM)]) einem statischen ([v ()) zu). 1), v (2), .. v (L)]) durch Faltung der Vergangenheit mit einer systemspezifischen linearen Filterbank (PDMs), siehe Marmarelis, 2004, Buch oder Marmarelis, Vasilis Z. "Modellierungsmethode für nichtlineare physiologische Systeme . " Annals of Biomedical Engineering 25.2 (1997): 239-251 ...

DankMasterDan
quelle