Die Frage, was aus diesem Lasso-Plot (glmnet) zu schließen ist, zeigt Lösungswege für den Lasso-Schätzer, die nicht monoton sind. Das heißt, einige der Cofficients nehmen im absoluten Wert zu, bevor sie schrumpfen.
Ich habe diese Modelle auf verschiedene Arten von Datensätzen angewendet und dieses Verhalten noch nie "in freier Wildbahn" gesehen und bis heute angenommen, dass sie immer monoton waren.
Gibt es klare Bedingungen, unter denen die Lösungswege garantiert monoton sind? Beeinflusst es die Interpretation der Ergebnisse, wenn die Pfade die Richtung ändern?
lasso
ridge-regression
elastic-net
Shadowtalker
quelle
quelle
Antworten:
Ich kann Ihnen eine gebe ausreichende Bedingung für den Pfad monotonen zu sein: ein orthonormal Design vonX .
Angenommen, eine orthonormale Entwurfsmatrix, mit Variablen in , ist . Bei einem orthonormalen Design sind die OLS-Regressionskoeffizienten einfach .p X ' XX β ols=X'yX′Xn= Ichp β^o l s= X′yn
Die Karush-Khun-Tucker-Bedingungen für den LASSO vereinfachen somit Folgendes:
Wobei der Subgradient ist. Daher haben wir für jedes das , und wir haben eine geschlossene Form Lösung für die Lasso-Schätzungen:j ∈ { 1 , ... , p } β o l s j = β l a s s o j + λ s js j ∈ { 1 , … , p } β^o l sj= β^l a s s oj+ λ sj
Welches ist monoton in . Dies ist zwar keine notwendige Bedingung, wir sehen jedoch, dass die Nicht-Monotonie aus der Korrelation der Kovariaten in herrühren muss .Xλ X
quelle