LASSO und adaptives LASSO sind zwei verschiedene Dinge, richtig? (Für mich sehen die Strafen anders aus, aber ich überprüfe nur, ob ich etwas verpasse.)
Wenn Sie allgemein von elastischem Netz sprechen, ist der Sonderfall LASSO oder adaptives LASSO?
Welches macht das glmnet-Paket, vorausgesetzt Sie wählen alpha = 1?
Adaptive LASSO funktioniert unter milderen Bedingungen, oder? Beide haben die Orakeleigenschaft in geeigneten Daten, oder?
lasso
glmnet
elastic-net
oracle
Herr Validierung
quelle
quelle
Adaptives LASSO wird zur konsistenten Variablenauswahl verwendet. Die Probleme, die bei der Verwendung des LASSO für die Variablenauswahl auftreten, sind:
Daher ist der LASSO nur für die Variablenauswahl unter bestimmten Bedingungen hinsichtlich des Schrumpfungsparameters, der Parameter (Beta-Min-Bedingung) und der Korrelationen (nicht darstellbare Bedingung) konsistent. Eine ausführliche Erklärung finden Sie auf den Seiten 101-106 meiner Masterarbeit .
Das LASSO enthält häufig zu viele Variablen, wenn der Abstimmungsparameter für die Vorhersage ausgewählt wird, aber das wahre Modell ist sehr wahrscheinlich eine Teilmenge dieser Variablen. Dies legt nahe, eine sekundäre Schätzstufe wie das adaptive LASSO zu verwenden, die die Vorspannung der LASSO-Schätzung unter Verwendung des vorhersageoptimalen Abstimmungsparameters steuert. Dies führt zu einer konsistenten Auswahl (oder Orakeleigenschaft) ohne die oben genannten Bedingungen.
Sie können glmnet für adaptives LASSO verwenden. Zuerst benötigen Sie eine anfängliche Schätzung, entweder die kleinsten Quadrate, die Grat- oder sogar die LASSO-Schätzung, um die Gewichte zu berechnen. Anschließend können Sie adaptives LASSO implementieren, indem Sie die X-Matrix skalieren. Hier ist ein Beispiel mit anfänglichen Schätzungen der kleinsten Quadrate für Trainingsdaten:
quelle