Ich habe meine lineare Regression reguliert, was nun?

7

Ich habe die Regressionsparameter eines linearen Regressionsmodells mit LASSO geschätzt, einige Variablen mithilfe der Kreuzvalidierung auf Null gesendet und jetzt ein endgültiges Modell erhalten. Es ist bekannt, dass das Regularisieren eine Verzerrung der aktiven Variablen hervorruft, aber es ist ein guter Preis, um falsche Variablen loszuwerden. Was mache ich jetzt, wo ich mein endgültiges Modell mit nur einem Fünftel der ursprünglichen Variablen habe? Sollte ich mich nur wie ein Champion mit der Tendenz zu den verbleibenden Variablen befassen, oder gibt es eine clevere Möglichkeit, fortzufahren?

Rodeo
quelle
1
Lieben Sie die No-Nonsense-Einstellung in Ihrer Frage :) Weiter so!
idnavid

Antworten:

5

Ein gängiger Ansatz besteht darin, die Regression (ohne Regularisierung) nur mit den von LASSO ausgewählten Variablen zu wiederholen.

Dies wird als "Inferenz nach der Auswahl" bezeichnet. Siehe Lee et al. 2016 für die Ermittlung von p-Werten und Konfidenzintervallen für die resultierenden Schätzungen.

The_Anomaly
quelle
1

Sie fragen sich vielleicht, was das Ziel beim Aufbau dieses Modells ist. Versuchen Sie, eine bessere Prognoseleistung zu erzielen? Oder Sie möchten ein lineares Modell, das statistisch signifikant ist. Diese beiden Ziele sind nicht unbedingt aufeinander abgestimmt.

Aus Sicht des maschinellen Lernens möchten Sie immer wissen, dass Sie über- oder unterpassend sind. Wenn Sie bereits unter Anpassung sind, wird die Regularisierung es noch schlimmer machen.

Haitao Du
quelle