In dieser Frage - Gibt es eine Methode zum Erstellen von Entscheidungsbäumen, die strukturierte / hierarchische / mehrstufige Prädiktoren berücksichtigt? - Sie erwähnen eine Paneldatenmethode für Bäume.
Gibt es spezielle Paneldatenmethoden zur Unterstützung von Vektormaschinen und neuronalen Netzen? Wenn ja, können Sie einige Artikel zu den Algorithmen und (falls verfügbar) R-Paketen zitieren, die diese implementieren?
r
machine-learning
svm
panel-data
cart
Carlos Cinelli
quelle
quelle
Antworten:
LSTM (Long Short Term Memory) könnte für Sie relevant sein. Dieser Modelltyp kann mehrere Features zu mehreren Zeitpunkten verarbeiten, die zu Paneldaten passen sollten. Hier ist eine sehr schöne Erklärung zum Konzept von LSTM, und hier ist ein Paket, das eine R-Version von LSTM implementiert.
quelle
Wenn Sie Paneldaten haben, gibt es verschiedene Aufgaben, die Sie zu lösen versuchen können, z. B. Zeitreihenklassifizierung / -regression oder Panelprognose. Und für jede Aufgabe gibt es zahlreiche Lösungsansätze.
Wenn Sie Methoden zum maschinellen Lernen verwenden möchten, um Panel-Prognosen zu lösen, gibt es eine Reihe von Ansätzen:
In Bezug auf Ihre Eingabedaten (X) können Sie Einheiten (z. B. Länder, Einzelpersonen usw.) als ID-Stichproben behandeln
In Bezug auf Ihre Ausgabedaten (y) können Sie mehrere Zeitpunkte für die Zukunft vorhersagen
Alle oben genannten Ansätze reduzieren das Panel-Prognoseproblem im Wesentlichen auf ein Zeitreihen-Regressions- oder ein tabellarisches Regressionsproblem. Sobald Ihre Daten im Zeitreihen- oder tabellarischen Regressionsformat vorliegen, können Sie auch beliebige zeitinvariante Funktionen für Benutzer anhängen.
Natürlich gibt es auch andere Möglichkeiten, um das Panel-Prognoseproblem zu lösen, beispielsweise die Verwendung klassischer Prognosemethoden wie ARIMA, die an Panel-Daten angepasst sind, oder Deep-Learning-Methoden, mit denen Sie direkt Sequenz-zu-Sequenz-Vorhersagen treffen können.
quelle