Was bedeutet Regularisierungspfad bei LASSO oder verwandten Sparsity-Problemen?

8

Wenn wir unterschiedliche Werte des Parameters auswählen , können wir Lösungen mit unterschiedlichen Sparsity-Levels erhalten. Bedeutet dies, dass der Regularisierungspfad die Auswahl der Koordinate ist, die eine schnellere Konvergenz erzielen könnte? Ich bin ein wenig verwirrt, obwohl ich oft von Sparsamkeit gehört habe. Könnten Sie bitte eine einfache Beschreibung der vorhandenen Problemlösungen geben?λLASSO

Bergbau
quelle

Antworten:

13

Angenommen, Sie haben ein Modell mit Prädiktorvariablen: . Setzen Sie auf einen Anfangswert und schätzen Sie Ihre Koeffizienten . Diese Koeffizienten können als Punkt im dimensionalen Raum betrachtet werden. *px1,x2,xpλβ1,β2,βpp

Wiederholen Sie den Vorgang für Ihren nächsten Wert von und erhalten Sie einen weiteren Satz von Schätzungen. Diese bilden einen weiteren Punkt im dimensionalen Raum. Wenn Sie dies für alle Ihre Werte tun , erhalten Sie eine Folge solcher Punkte. Diese Sequenz ist der Regularisierungspfad.λpλ


* Es gibt auch den Intercept-Term so dass all dies technisch im -dimensionalen Raum stattfindet, aber das macht nichts. Auf Fall standardisieren die meisten elastischen Netz- / Lasso-Programme die Variablen vor dem Anpassen des Modells, sodass immer 0 ist.β0(p+1)β0

Hong Ooi
quelle
4

Eine grafische Erläuterung der Lasso-Lösung finden Sie auf den Seiten 69-73 des Textes "Elemente des statistischen Lernens" (Online-Version hier ).

drollix
quelle
1
Danke mein Herr! Ja! Das Fig. 3.10ist der Lasso-Regularisierungspfad.
Bergbau