Sehr grundlegende Frage hier, aber ich möchte verstehen (nicht mathematisch), wie die Tatsache, eine "Strafe" (Summe der quadratischen Koeffizienten mal Skalar) zur verbleibenden Quadratsumme hinzuzufügen, große Koeffizienten reduzieren kann? Vielen Dank !
7
Antworten:
Weil Ihre "Strafe" -Darstellung des Minimierungsproblems nur die weitreichende Form eines Problems der Einschränkungsoptimierung ist:
Nehmen Sie zentrierte Variablen an. In beiden Fällen, Lasso und Ridge, ist Ihre uneingeschränkte Zielfunktion dann die übliche Summe der quadratischen Residuen. dh gegebene Regressoren, die Sie minimieren: über alles .p
Im Fall einer Gratregression minimieren Sie so, dass für einen Wert von . Für kleine Werte von es unmöglich, dieselbe Lösung wie im Standard-Szenario der kleinsten Quadrate abzuleiten. In diesem Fall minimieren Sie nur Denken Sie an dann an Die einzig mögliche Lösung kann .R. S.S.( β )
Andererseits minimieren Sie im Fall des Lassos unter der Bedingung für einen Wert von .R. S.S.( β)
Beide eingeschränkten Optimierungsprobleme können in Bezug auf ein nicht eingeschränktes Optimierungsproblem äquivalent dargestellt werden, dh für das Lasso: Sie können äquivalent minimieren
quelle