Ich möchte den AICc eines Gratregressionsmodells berechnen. Das Problem ist die Anzahl der Parameter. Für die lineare Regression schlagen die meisten Menschen vor, dass die Anzahl der Parameter der Anzahl der geschätzten Koeffizienten plus Sigma (der Varianz des Fehlers) entspricht.
Wenn es um die Gratregression geht, lese ich, dass die Spur der Hutmatrix - der Freiheitsgrad (df) - einfach als Anzahl der Parameter in der AIC-Formel verwendet wird (z. B. hier oder hier ).
Ist das richtig? Kann ich den AICc auch einfach mit dem df berechnen? Kann ich einfach +1 zum df addieren, um die Fehlervarianz zu berücksichtigen?
regression
aic
ridge-regression
degrees-of-freedom
julianisch
quelle
quelle
Antworten:
AIC- und Ridge-Regression können kompatibel gemacht werden, wenn bestimmte Annahmen getroffen werden. Es gibt jedoch keine einzige Methode zur Auswahl einer Schrumpfung für die Kammregression, sodass es keine allgemeine Methode zur Anwendung von AIC auf diese gibt. Die Ridge-Regression ist eine Teilmenge der Tikhonov-Regularisierung . Es gibt viele Kriterien , die zur Auswahl der Glättungsfaktoren für Tikhonov Regularisierung angewendet werden können, siehe zB dies . Um AIC in diesem Zusammenhang zu verwenden, gibt es ein Papier, das ziemlich spezifische Annahmen darüber macht, wie diese Regularisierung durchgeführt werden soll: Auswahl von auf der Informationskomplexität basierenden Regularisierungsparametern zur Lösung von schlecht konditionierten inversen Problemen . Im Einzelnen wird dies vorausgesetzt
„In einem statistischen Rahmen, ... den Wert des Regelungsparameter entschieden α und durch die maximale Wahrscheinlichkeit bestraft Verwendung (MPL) Methode .... Wenn man bedenkt unkorreliert Gaußsches Rauschen mit der Varianzσ2 und verwende die Strafe p(x)= eine komplizierte Norm, siehe Link oben , die MPL-Lösung ist die gleiche wie die von Tikhonov (1963) regulierte Lösung. "
Dann stellt sich die Frage, ob diese Annahmen getroffen werden sollten. Die Frage nach den benötigten Freiheitsgraden ist zweitrangig gegenüber der Frage, ob AIC und Gratregression in einem konsistenten Kontext verwendet werden. Ich würde vorschlagen, den Link für Details zu lesen. Ich vermeide die Frage nicht, es ist nur so, dass man viele Dinge als Kammziele verwenden kann, zum Beispiel könnte man den Glättungsfaktor verwenden, der den AIC selbst optimiert . Daher verdient eine gute Frage die andere: "Warum sollte man sich mit AIC im Kammkontext beschäftigen?" In einigen Gratregressionskontexten ist es schwierig zu erkennen, wie AIC relevant gemacht werden könnte. Beispielsweise wurde eine Gratregression angewendet, um die relative Fehlerausbreitung vonb , d. H. Min [SD(b)b] der Gammaverteilung (GD) gegeben durch
quelle