Die bestrafte L1-Regression (auch bekannt als Lasso) wird in zwei Formulierungen dargestellt. Die beiden Zielfunktionen seien Dann sind die beiden unterschiedlichen Formulierungen Argminβ
quelle
Die bestrafte L1-Regression (auch bekannt als Lasso) wird in zwei Formulierungen dargestellt. Die beiden Zielfunktionen seien Dann sind die beiden unterschiedlichen Formulierungen Argminβ
Die zwei Formulierungen sind äquivalent in dem Sinne, dass für jeden Wert von in der ersten Formulierung ein Wert von & lgr; für die zweite Formulierung existiert, so dass die zwei Formulierungen den gleichen Minimierer & bgr; aufweisen .
Hier ist die Begründung:
Betrachten Sie die Lasso-Formulierung: Sei der Minimiererβ∗und seib=| | β∗| | 1. Meine Behauptung ist, dass, wenn Siein der ersten Formulierungt=b setzen, die Lösung der ersten Formulierung ebenfallsβ∗ ist. Hier ist der Beweis:
Betrachten Sie die erste Formulierung wenn möglich diese zweite Formulierung lassen hat eine Lösung β , so dass| | & bgr; | | 1<| | β∗| | 1=b(beachten Sie das streng weniger als Zeichen). Dann ist es leicht zu sehendassf( β )<f(β
Da , ist die komplementäre Schlaffheitsbedingung am Lösungspunkt β ∗ erfüllt .
Wenn Sie also eine Lasso-Formulierung mit , konstruieren Sie eine beschränkte Formulierung mit einem t , das dem Wert der l 1 -Norm der Lasso-Lösung entspricht. Umgekehrt erhalten Sie bei einer eingeschränkten Formulierung mit t ein λ, so dass die Lösung des Lassos gleich der Lösung der eingeschränkten Formulierung ist.
(Wenn Sie Subgradienten kennen, können Sie dieses indem Sie die Gleichung X T ( y - X β ∗ ) = λ z ∗ lösen , wobei z ∗ ∈ ∂ | | β ∗ | | 1 )
Ich denke, dass die Idee von elexhobby für diesen Beweis gut ist, aber ich denke nicht, dass es völlig richtig ist.
Zeigen , dass das Vorhandensein einer Lösung für die erste , so dass ‖ β ‖ < ‖ β * ‖ führt zu einem Widerspruch, können wir nur die Notwendigkeit , übernehmen von ‖ β ‖ = ‖ β * ‖ , nicht dass β = β *β^ ∥β^∥<∥β∗∥ ∥β^∥=∥β∗∥ β^=β∗ .
Ich schlage stattdessen vor, wie folgt vorzugehen:
Der Einfachheit halber bezeichnen wir die erste und die zweite Formulierung mit bzw. P 2 . Nehmen wir an, dass P 2 eine eindeutige Lösung β ∗ mit ‖ β ∗ ‖ = b hat . Lassen P 1 eine Lösung, & bgr; & ne; & bgr; * . Dann haben wir das ‖ β ‖ ≤ ‖ β * ‖ (es kann nicht größer sein , weil der Zwang) und damit f ( β )P1 P2 P2 β∗ ∥β∗∥=b P1 β^≠β∗ ∥β^∥≤∥β∗∥ . Wenn f ( β ) < f ( β * ) dann β * ist nicht die Lösung für den P 2 , die unsere Annahmen widerspricht. Wenn f ( β ) = f ( β * ) dann β = β * , da wir die Lösung eindeutig sein angenommen.f(β^)≤f(β∗) f(β^)<f(β∗) β∗ P2 f(β^)=f(β∗) β^=β∗
quelle