Ich lese immer wieder über Fälle, in denen wir die Daten zentrieren (z. B. mit Regularisierung oder PCA), um den Intercept zu entfernen (wie in dieser Frage erwähnt ). Ich weiß, dass es einfach ist, aber es fällt mir schwer, das intuitiv zu verstehen. Könnte jemand die Intuition oder eine Referenz liefern, die ich lesen kann?
regression
pca
centering
Alec
quelle
quelle
Antworten:
Können diese Bilder helfen?
Die ersten beiden Bilder handeln von Regression. Durch das Zentrieren der Daten wird die Steigung der Regressionslinie nicht geändert, der Achsenabschnitt wird jedoch auf 0 gesetzt.
quelle
PCA is maximizing variance
Dies ist im Allgemeinen nicht wahr. PCA maximiert (nach dem 1. PC) die Summe der quadratischen Abweichungen vom Ursprung. Nur wenn die Daten vorab zentriert wurden (das Zentrieren selbst ist kein Teil der PCA), wird die Varianz maximiert.