Ist es möglich, AIC- oder BIC-Werte für Lasso-Regressionsmodelle und andere regulierte Modelle zu berechnen, bei denen Parameter nur teilweise in die Gleichung eingehen? Wie bestimmt man die Freiheitsgrade?
Ich verwende R, um Lasso-Regressionsmodelle mit der glmnet()
Funktion aus dem glmnet
Paket zu versehen, und möchte wissen, wie AIC- und BIC-Werte für ein Modell berechnet werden. Auf diese Weise kann ich die Werte mit Modellen vergleichen, die ohne Regularisierung passen. Ist das möglich zu tun?
Antworten:
Möglicherweise interessieren Sie auch die folgenden Artikel:
quelle
Ich hatte große Probleme damit, AIC und BIC für glmnet-Modelle zu berechnen. Nach einigem Suchen fand ich jedoch auf der dritten Seite der Google-Ergebnisse die Antwort. Es kann hier gefunden werden . Ich poste es hier für zukünftige Leser, da ich glaube, dass ich nicht der einzige sein kann.
Am Ende habe ich den AIC und den BIC folgendermaßen implementiert:
quelle
In dem Link, auf den Johnnyheineken verweist, heißt es:
Es scheint mir, dass, wenn Sie den AIC zwischen zwei Modellen vergleichen, die Tatsache, dass Sie die Nullabweichung nicht trennen können, keine Rolle spielen sollte. Da es auf beiden "Seiten" der Ungleichung existiert, würde es zeigen, welches Modell den niedrigeren AIC haben muss. Dies hängt von zwei Dingen ab:
quelle