Soweit ich weiß, werden Hauptkomponenten durch Drehen der Koordinatenachsen erhalten, um sie an den Richtungen der maximalen Varianz auszurichten.
Trotzdem lese ich immer wieder über "nicht gedrehte Hauptkomponenten" und meine Statistiksoftware (SAS) gibt mir sowohl varimax-gedrehte als auch nicht gedrehte Hauptkomponenten. Hier bin ich verwirrt: Wenn wir Hauptkomponenten berechnen, sind die Achsen bereits gedreht; Warum ist dann eine weitere Drehung erforderlich? Und was bedeutet "nicht gedrehte Hauptkomponente"?
pca
terminology
factor-rotation
Srewashi Lahiri
quelle
quelle
Antworten:
Dies wird eine nicht technische Antwort sein.
Sie haben Recht: PCA ist im Wesentlichen eine Drehung der Koordinatenachsen, die so gewählt wird, dass jede erfolgreiche Achse so viel Varianz wie möglich erfasst.
In einigen Disziplinen (wie z. B. Psychologie) wenden die Menschen PCA gerne an, um die resultierenden Achsen zu interpretieren. Das heißt, sie möchten sagen können, dass die Hauptachse # 1 (die eine bestimmte lineare Kombination der ursprünglichen Variablen ist) eine bestimmte Bedeutung hat. Um diese Bedeutung zu erraten, würden sie die Gewichte in der linearen Kombination betrachten. Diese Gewichte sind jedoch oft unübersichtlich und es kann keine klare Bedeutung festgestellt werden.
In diesen Fällen wird manchmal ein wenig an der Vanille-PCA-Lösung herumgebastelt. Sie nehmen bestimmte Anzahl von Hauptachsen (die „signifikant“ durch ein Kriterium angesehen werden), und zusätzlich drehen sie, versuchen , einig „einfache Struktur“ zu erreichen --- die Linearkombinationen, die einfacher wären , zu interpretieren. Es gibt spezielle Algorithmen, die nach einer möglichst einfachen Struktur suchen. einer von ihnen heißt varimax. Nach der Varimax-Rotation erfassen aufeinanderfolgende Komponenten nicht mehr so viel Varianz wie möglich! Diese Funktion von PCA wird durch die zusätzliche Varimax-Drehung (oder eine andere Drehung) beeinträchtigt.
Bevor Sie also die Varimax-Rotation anwenden, haben Sie "nicht gedrehte" Hauptkomponenten. Und danach erhalten Sie "gedrehte" Hauptkomponenten. Mit anderen Worten bezieht sich diese Terminologie auf die Nachbearbeitung der PCA-Ergebnisse und nicht auf die PCA-Rotation selbst.
All dies ist etwas kompliziert durch die Tatsache, dass das, was gedreht wird, Belastungen und nicht Hauptachsen als solche sind. In Bezug auf die mathematischen Details verweise ich Sie (und jeden interessierten Leser) auf meine lange Antwort hier: Wird nach der PCA noch eine Rotation (wie Varimax) nach der PCA durchgeführt?
quelle
what gets rotated are loadings and not principal axes as such
Ich würde hinzufügen, dass dies ein technischer Begriff ist. Theoretisch sind diese beiden Rotationsarten nebeneinander. In PCA rotieren wir, um die spezifische orthogonale Basis zu finden (die mit der steilsten Geröllkurve von Eigenwerten). In varimax rotieren wir, um eine andere spezifische orthogonale Basis zu finden (mit der Interpetable-Most-Struktur). Wir könnten jede Art von orthogonaler Basis machen.