Ich erstelle eine logistische Regression in R mithilfe der LASSO-Methode mit den Funktionen cv.glmnet
zur Auswahl des lambda
und glmnet
für das endgültige Modell.
Ich kenne bereits alle Nachteile in Bezug auf die automatische Modellauswahl, aber ich muss es trotzdem tun.
Mein Problem ist, dass ich Faktor- (kategoriale) Variablen in das Modell aufnehmen muss. Gibt es eine Möglichkeit, dies zu tun, ohne viele Dummy-Variablen zu erstellen? Diese Variablen sind fast alle Zeichenfolgen und keine Zahlen.
Antworten:
glmnet kann den Faktor nicht direkt annehmen. Sie müssen Faktorvariablen in Dummies umwandeln. Mit model.matrix ist dies nur ein einfacher Schritt, zum Beispiel:
alpha = 1 wird ein LASSO bauen.
quelle