Der PCA-Algorithmus kann anhand der Korrelationsmatrix formuliert werden (vorausgesetzt, die Daten bereits normalisiert und es wird nur die Projektion auf den ersten PC in Betracht gezogen). Die Zielfunktion kann wie folgt geschrieben werden:
Dies ist in Ordnung, und wir verwenden Lagrange-Multiplikatoren, um es zu lösen, dh umzuschreiben als:
das ist äquivalent zu
und daher ( siehe hier auf Mathworld ) scheint
Dies bedeutet jedoch, dass der Abstand zwischen Punkt und Linie maximiert werden soll, und nach dem, was ich hier gelesen habe , ist dies falsch - es sollte , nicht . Wo ist mein Fehler?
Oder kann mir jemand den Zusammenhang zwischen der Maximierung der Varianz im projizierten Raum und der Minimierung des Abstands zwischen Punkt und Linie zeigen?
quelle
Antworten:
Let eine zentrierte Datenmatrix mit seiner Beobachtungen in Reihen. Sei seine Kovarianzmatrix. Sei ein Einheitsvektor, der eine Achse im Variablenraum angibt. Wir wollen, dass die erste Hauptachse ist.X n Σ=X⊤X/(n−1) w w
Gemäß dem ersten Ansatz maximiert die erste Hauptachse die Varianz der Projektion (Varianz der ersten Hauptkomponente). Diese Varianz ist gegeben durchXw
Gemäß dem zweiten Ansatz minimiert die erste Hauptachse den Rekonstruktionsfehler zwischen und seiner Rekonstruktion , dh die Summe der quadratischen Abstände zwischen den ursprünglichen Punkten und ihren Projektionen auf . Das Quadrat des Rekonstruktionsfehlers ergibt sich ausX Xww⊤ w
Beachten Sie das Minuszeichen vor dem Hauptbegriff. Aus diesem Grund läuft das Minimieren des Rekonstruktionsfehlers darauf hinaus, , also die Varianz, zu maximieren . Die Minimierung des Rekonstruktionsfehlers entspricht also der Maximierung der Varianz. beide Formulierungen ergeben das gleiche .w⊤Σw w
quelle