Ich arbeite derzeit daran, ein Vorhersagemodell für ein binäres Ergebnis in einem Datensatz mit ~ 300 Variablen und 800 Beobachtungen zu erstellen. Ich habe auf dieser Website viel über die Probleme gelesen, die mit der schrittweisen Regression verbunden sind, und warum man sie nicht verwendet.
Ich habe die LASSO-Regression und ihre Fähigkeit zur Funktionsauswahl gelesen und konnte sie erfolgreich mithilfe des "caret" -Pakets und "glmnet" implementieren.
Ich bin in der Lage, den Koeffizienten des Modells mit dem Optimum lambda
und alpha
aus "caret" zu extrahieren ; Ich bin jedoch nicht mit der Interpretation der Koeffizienten vertraut.
- Werden die LASSO-Koeffizienten nach der gleichen Methode wie die logistische Regression interpretiert?
- Wäre es angemessen, die von LASSO ausgewählten Funktionen für die logistische Regression zu verwenden?
BEARBEITEN
Interpretation der Koeffizienten wie bei den potenzierten Koeffizienten aus der LASSO-Regression als logarithmische Wahrscheinlichkeit für eine Änderung des Koeffizienten um 1 Einheit, während alle anderen Koeffizienten konstant gehalten werden.
quelle
Antworten:
Lassen Sie mich umformulieren: Werden die LASSO-Koeffizienten genauso interpretiert wie beispielsweise die
OLS-Maximum-Likelihood-Koeffizienten in einer logistischen Regression?LASSO (eine bestrafte Schätzmethode) zielt darauf ab, die gleichen Größen (Modellkoeffizienten) zu
schätzen wie beispielsweise diemaximale Wahrscheinlichkeit vonOLS(eine nicht bestrafte Methode). Das Modell ist das gleiche und die Interpretation bleibt gleich. Die numerischen Werte von LASSO unterscheiden sich normalerweise von denen der maximalen Wahrscheinlichkeit vonOLS: Einige sind näher an Null, andere sind genau Null. Wenn ein vernünftiger Betrag an Bestrafung angewendet wurde, liegen die LASSO-Schätzungen näher an den wahren Werten als dieOLS-Maximum-Likelihood-Schätzungen, was ein wünschenswertes Ergebnis ist.Damit ist kein Problem verbunden, aber Sie können LASSO nicht nur zur Merkmalsauswahl, sondern auch zur Koeffizientenschätzung verwenden. Wie oben erwähnt, sind LASSO-Schätzungen möglicherweise genauer als beispielsweise
OLS-Maximum-Likelihood-Schätzungen.quelle