Berücksichtigen Sie die lineare Regression mit einer gewissen Regularisierung: ZB Finden Sie , das minimiert| | A x - b | | 2 + λ | | x | | 1
Normalerweise sind die Spalten von A so standardisiert, dass sie den Mittelwert Null und die Einheitennorm haben, während so zentriert ist, dass es den Mittelwert Null hat. Ich möchte sicherstellen, dass ich den Grund für das Standardisieren und Zentrieren richtig verstanden habe.
Indem wir die Mittelwerte der Spalten und Null setzen, brauchen wir keinen Intercept-Term mehr. Andernfalls wäre das Ziel . Indem wir die Normen der Spalten von A gleich 1 machen, beseitigen wir die Möglichkeit eines Falls, in dem nur eine Spalte von A eine sehr hohe Norm hat, einen niedrigen Koeffizienten in erhält , was dazu führen könnte, dass wir fälschlicherweise auf diese Spalte von schließen A "erklärt" gut.b | | A x - x 0 1 - b | | 2 + λ | | x | | 1 x x
Diese Argumentation ist nicht gerade streng, aber intuitiv. Ist das die richtige Art zu denken?
$x$ does not ''explain'' $A$ well
und meinst dux does not ''explain'' $A$ at all
? sind die Daten, während in diesem Fall das Modell ist. x