Nachdem ich einen der "Forschungstipps" von RJ Hyndman über Kreuzvalidierung und Zeitreihen gelesen hatte , kam ich auf eine alte Frage zurück, die ich hier zu formulieren versuchen werde. Die Idee ist, dass bei Klassifizierungs- oder Regressionsproblemen die Reihenfolge der Daten nicht wichtig ist und daher eine k- fache Kreuzvalidierung verwendet werden kann. Andererseits ist in Zeitreihen die Reihenfolge der Daten offensichtlich von großer Bedeutung.
Wenn jedoch ein maschinelles Lernmodell zur Vorhersage von Zeitreihen verwendet wird, besteht eine übliche Strategie darin, die Reihe in eine Menge von "Eingabe-Ausgabe-Vektoren" , die für eine Zeit haben die Form .
Können wir nun nach dieser Umformung davon ausgehen, dass die resultierende Menge von "Eingabe-Ausgabe-Vektoren" nicht sortiert werden muss? Wenn wir zum Beispiel ein vorwärtsgerichtetes neuronales Netzwerk mit n Eingängen verwenden, um diese Daten zu "lernen", würden wir unabhängig von der Reihenfolge, in der wir die Vektoren für das Modell anzeigen, zu den gleichen Ergebnissen gelangen. Könnten wir daher die k-fache Kreuzvalidierung auf die übliche Weise verwenden, ohne das Modell jedes Mal neu anpassen zu müssen?