Ich habe mich gefragt, ob es (unbeaufsichtigt) maschinelle Lerntechniken zur Modellierung von Längsschnittdaten gibt. Ich habe immer Modelle mit gemischten Effekten verwendet (meistens nicht linear), aber ich habe mich gefragt, ob es andere Möglichkeiten gibt (maschinelles Lernen).
Mit maschinellem Lernen meine ich zufällige Gesamtstruktur, Klassifizierung / Clustering, Entscheidungsbäume und sogar tiefes Lernen usw.
machine-learning
mixed-model
John_dydx
quelle
quelle
Antworten:
In dem Fall, in dem mehrere Beobachtungen von einem Probanden vorliegen (z. B. mehrere Besuche desselben Patienten), ist die "Patienten-ID" eine "Gruppierungs" -Variable. Bei der Modellbewertung muss darauf geachtet werden, dass Besuche desselben Patienten nicht sowohl in den Trainings- als auch in den Testdaten erscheinen, da diese korreliert sind und zu einer Inflation der Klassifikatorgenauigkeit führen .
Die Cross-Validation-sklearn-Dokumentation enthält Cross-Validation-Iteratoren für gruppierte Daten. Siehe GroupKFold , LeaveOneGroupOut und LeavePGroupsOut .
Versuchen Sie noch besser wiederkehrende neuronale Netze oder Hidden-Markov-Modelle .
quelle
Sie können Ihre Längsrichtung mit Standardmethoden für maschinelles Lernen modellieren, indem Sie nur Features hinzufügen, die die Längsrichtung darstellen, z. B. indem Sie ein Feature hinzufügen, das die Zeit darstellt. Oder eine Funktion, die die Mitgliedschaft in einer Gruppe, Person usw. angibt (im Fall der Paneldaten).
Wenn Sie kreativ mit der Erstellung / Extraktion von Features sind, können Sie alles mit ML-Algorithmen modellieren.
quelle