Die Hauptkomponentenanalyse kann eine Matrixzerlegung verwenden, dies ist jedoch nur ein Werkzeug, um dorthin zu gelangen.
Wie würden Sie die Hauptkomponenten ohne die Verwendung von Matrixalgebra finden?
Was ist die objektive Funktion (Ziel) und welche Einschränkungen gibt es?
Antworten:
Ohne zu versuchen, auf PCA einen vollständigen Primer zu geben, ist vom Standpunkt der Optimierung die primäre Zielfunktion der Rayleigh-Quotient . Die im Quotienten angegebene Matrix ist (ein Vielfaches davon) die Beispiel-Kovarianzmatrix wobei jedes ein Vektor von Merkmalen ist und die Matrix ist, so dass die te Zeile .
PCA versucht, eine Folge von Optimierungsproblemen zu lösen. Das erste in der Sequenz ist das uneingeschränkte Problem
Daist das obige uneingeschränkte Problem gleichbedeutend mit dem eingeschränkten ProblemuTu=∥u∥22=∥u∥∥u∥
Hier kommt die Matrixalgebra ins Spiel. Da eine symmetrisch positive semidefinite Matrix ist (konstruktionsbedingt!), Hat sie eine Eigenwertzerlegung der Form wobei eine ist orthogonale Matrix (also ) und ist eine diagonale Matrix mit nichtnegativen Einträgen so dass .S
Daher ist . Da im Problem auf eine Norm von eins beschränkt ist, gilt dies auch für da , da orthogonal ist.uTSu=uTQΛQTu=wTΛw=∑pi=1λiw2i u w ∥w∥2=∥QTu∥2=∥u∥2=1 Q
Aber wenn wir die Menge unter den Bedingungen , dann ist das Beste, was wir tun können, zu setze , und für .∑pi=1λiw2i ∑pi=1w2i=1 w=e1 w1=1 wi=0 i>1
Wenn wir nun das entsprechende , nach dem wir zuerst gesucht haben, erhalten wir Folgendes: wobei bezeichnet die erste Spalte von , dh den Eigenvektor, der dem größten Eigenwert von . Der Wert der Zielfunktion wird dann auch leicht als .u
Die verbleibenden Hauptkomponentenvektoren werden dann durch Lösen der mit indizierten Folge von Optimierungsproblemen gefunden. Das Problem ist also dasselbe, außer dass wir die zusätzliche Einschränkung hinzufügen, dass die Lösung zu allen vorherigen Lösungen in der Sequenz orthogonal sein muss . Es ist nicht schwierig , das Argument oben induktiv zu zeigen , zu verlängern , dass die Lösung der - ten Problem ist in der Tat , der - te Eigenvektor .i
Die PCA-Lösung wird häufig auch als Singularwertzerlegung von ausgedrückt . Um zu sehen , warum, lassen . Dann ist und so (Streng genommen bis zum Signieren von Flips) und .X X=UDVT nS=XTX=VD2VT V=Q Λ=D2/n
Die Hauptkomponenten werden durch Projizieren von auf die Hauptkomponentenvektoren gefunden. Aus der gerade gegebenen SVD-Formulierung ist leicht ersichtlich, dassX
Die Einfachheit der Darstellung sowohl der Hauptkomponentenvektoren als auch der Hauptkomponenten selbst in Bezug auf die SVD der Merkmalsmatrix ist ein Grund, warum die SVD bei einigen Behandlungen von PCA so prominent ist.
quelle
Die von cardinal vorgestellte Lösung konzentriert sich auf die Kovarianzmatrix der Stichprobe. Ein weiterer Ausgangspunkt ist der Rekonstruktionsfehler der Daten durch eine q- dimensionale Hyperebene. Wenn die p- dimensionalen Datenpunkte das Ziel zu lösenx1,…,xn
für eine Matrix mit orthonormalen Spalten und . Dies ergibt die beste Rang- q- Rekonstruktion, gemessen durch die euklidische Norm, und die Spalten der Lösung sind die ersten q Hauptkomponentenvektoren.p×q Vq λi∈Rq Vq
Für festes lautet die Lösung für und (dies ist eine Regression)Vq μ λi
Nehmen wir zur Vereinfachung der Notation an, dass in den folgenden Berechnungen zentriert wurde. Wir müssen dann minimierenxi
über mit orthonormalen Spalten. Beachten Sie, dass die Projektion auf den q- dimensionalen Spaltenraum ist. Daher ist das Problem äquivalent zum Minimieren von über Rang q Projektionen . Das heißt, wir müssen Maximierungs über Rang q- Projektionen , wobei die Beispiel-Kovarianzmatrix ist. JetztVq P=VqVTq
Der Rekonstruktionsfehler weist auf eine Reihe nützlicher Verallgemeinerungen hin, beispielsweise auf spärliche Hauptkomponenten oder Rekonstruktionen durch niedrigdimensionale Mannigfaltigkeiten anstelle von Hyperebenen. Einzelheiten finden Sie in Abschnitt 14.5 unter Die Elemente des statistischen Lernens .
quelle
In NIPALS ( Wiki ) finden Sie einen Algorithmus, der keine explizite Matrixzerlegung verwendet. Ich nehme an, das meinst du, wenn du sagst, dass du Matrixalgebra vermeiden willst, da du Matrixalgebra hier wirklich nicht vermeiden kannst :)
quelle