Wenn ich mein Lambda durch Kreuzvalidierung bestimme, werden alle Koeffizienten Null. Aber ich habe einige Hinweise aus der Literatur, dass einige der Prädiktoren definitiv das Ergebnis beeinflussen sollten. Ist es Unsinn, Lambda willkürlich zu wählen, damit es genauso wenig Sparsamkeit gibt, wie man möchte?
Ich möchte die Top 10 oder so Prädiktoren aus 135 für ein Cox-Modell auswählen und die Effektgrößen sind leider klein.
Antworten:
Wenn Sie mindestens eine bestimmte Anzahl von Prädiktoren mit einem in der Literatur definierten Wertebereich haben möchten, warum sollten Sie sich zunächst für den reinen LASSO-Ansatz entscheiden? Wie von @probabilityislogic vorgeschlagen, sollten Sie einige informative Prioritäten für die Variablen verwenden, über die Sie etwas wissen. Wenn Sie einige der LASSO-Eigenschaften für den Rest der Prädiktoren beibehalten möchten, können Sie möglicherweise einen Prior mit einer doppelten Exponentialverteilung für jede andere Eingabe verwenden, dh eine Dichte der Form wobeiλder Lagrange-Multiplikator ist, der der reinen LASSO-Lösung entspricht. Diese letzte Aussage ergibt sich aus der Tatsache, dass dies in Abwesenheit der Variablen mit den informativen Prioritäten eine weitere Möglichkeit ist, den LASSO abzuleiten (durch Maximierung des posterioren Modus unter Berücksichtigung der Normalitätsannahmen für die Residuen).
quelle
Es gibt eine gute Möglichkeit, LASSO durchzuführen, aber eine feste Anzahl von Prädiktoren zu verwenden. Es handelt sich um die in Efrons Artikel beschriebene Regression des kleinsten Winkels (LAR oder LARS). Während des iterativen Vorgangs werden mehrere lineare Modelle erstellt. Jedes neue Modell verfügt über einen weiteren Prädiktor, sodass Sie eines mit der gewünschten Anzahl von Prädiktoren auswählen können.
Ein anderer Weg ist oder l 2l1 l2 Regularisierung. Wie von Nestor unter Verwendung geeigneter Prioritäten erwähnt, können Sie Vorkenntnisse in das Modell integrieren. Eine sogenannte Relevanzvektormaschine durch Tippen kann nützlich sein.
quelle
Beachten Sie auch, dass Sie einige Koeffizienten ungestraft lassen können, wenn Sie beispielsweise Lasso ausführen
glmnet
.quelle