Sollte ich beim Übergang von der zur Normalisierung in der linearen Regression mehr Verzerrung oder Varianz erwarten? Beachten Sie, dass die Vorspannung ein Zeichen für eine Unteranpassung ist und die Varianz ein Zeichen für eine Überanpassung ist. Nehmen Sie eine Konstante λ an.
Ich suche hier eine allgemeine Faustregel. Wenn es keinen gibt und die Antwort von einigen anderen Faktoren abhängt, die ich nicht berücksichtigt habe, erklären Sie dies bitte.
Antworten:
Die Varianz wird zunehmen, das Problem bei der L1-Regularisierung besteht darin, dass einige der Koeffizienten höchst unvorhersehbar sind. Die Antwort hängt davon ab, wie stark Ihre Regularisierung ist (λ Wert). Ich habe eine Sinuswelle mit Gaußschem Rauschen mit verschiedenen Samen erzeugt und was beobachtet wird, ist genauso niedrigλ Wert Die l1-Norm hat eine geringere Varianz als λ Werte erhöhen die l2-Norm hat eine geringere Varianz.
Wie Sie im Bild sehen können, ist das Alpha der Regularisierungskoeffizient. beimα = 1 e - 15 entsprechend sehen wir den großen Unterschied zwischen den Rigde-Regressionskoeffizienten, aber wenn Alpha zunimmt, nimmt die Abweichung im Grat drastisch ab. aber wennα = 10 Das Lasso und der Grat weisen beide eine geringere Varianz auf. Wenn das Alpha abnimmt, nimmt die Varianz des Kamms drastisch zu.
PS: Ich habe mehrmals mit diesem Setup experimentiert und der Trend ist konsistent.λ Wert.)
Wenn Sie also Ihre Frage beantworten, erhöht sich die Varianz, wenn Sie vom L1- zum L2-Regularisierer wechseln (und das Ausmaß der Erhöhung hängt davon ab
auch ich habe die dot produkte von hinzugefügtW. vector.just um zu sehen, wie unterschiedlich die w . Die diagonalen Einträge sind -ve, was besagt, dass es einen großen Unterschied zwischen den gibtW.s . Dies wird durch eine detailliertere Analyse weiter ausgebaut.
quelle