Mein Verständnis der LASSO-Regression ist, dass die Regressionskoeffizienten ausgewählt werden, um das Minimierungsproblem zu lösen:
In der Praxis wird dies mit einem Lagrange-Multiplikator durchgeführt, wodurch das Problem gelöst werden muss
Wie ist die Beziehung zwischen und t ? Wikipedia gibt unbeholfen einfach an, dass dies "datenabhängig" ist.
Warum kümmert es mich? Erstens aus intellektueller Neugier. Ich bin aber auch besorgt über die Konsequenzen für die Auswahl von durch Kreuzvalidierung.
Insbesondere wenn ich eine n-fache Kreuzvalidierung durchführe, passe ich n verschiedene Modelle an n verschiedene Partitionen meiner Trainingsdaten an. Ich vergleiche dann die Genauigkeit jedes Modells anhand der nicht verwendeten Daten für ein gegebenes . Das gleiche λ impliziert jedoch eine unterschiedliche Einschränkung ( t ) für unterschiedliche Teilmengen der Daten (dh t = f ( λ ) ist "datenabhängig").
quelle
Antworten:
Dies ist die Standardlösung für die Gratregression :
quelle