Ich bin gerade dabei, ein Dia-Set für die "Faktoranalyse" zu durchlaufen (PCA, soweit ich das beurteilen kann).
Darin wird der "Fundamentalsatz der Faktoranalyse" abgeleitet, der besagt, dass die Korrelationsmatrix der in die Analyse Daten ( ) unter Verwendung der Matrix der Faktorladungen ( ) wiederhergestellt werden kann :
Das verwirrt mich jedoch. In PCA ist die Matrix der "Faktorladungen" durch die Matrix der Eigenvektoren der Kovarianz / Korrelationsmatrix der Daten gegeben (da wir annehmen, dass die Daten standardisiert wurden, sind sie gleich), wobei jeder Eigenvektor skaliert ist, um zu haben Länge eins. Diese Matrix ist orthogonal, also was im Allgemeinen nicht gleich .
pca
factor-analysis
terminology
definition
user2249626
quelle
quelle
A
aus Gründen der Klarheit nicht, die Eigenvektormatrix (die Ladungen sind) zu nennen . Die (rechte) Eigenvektormatrix ist normalerweise beschriftetV
(weilR=USV'
von svd), nichtA
. Ein anderer äquivalenter Name (der aus der Biplot-Terminologie stammt) für Eigenvektoren ist "Standardkoordinaten" und für Ladungen "Hauptkoordinaten".Antworten:
Dies ist eine vernünftige Frage (+1), die sich aus der terminologischen Mehrdeutigkeit und Verwirrung ergibt.
Im Zusammenhang mit PCA werden Hauptachsen (Eigenvektoren der Kovarianz / Korrelationsmatrix) häufig als "Belastungen" bezeichnet. Dies ist eine schlampige Terminologie. Was in PCA eher als "Belastungen" bezeichnet werden sollte, sind Hauptachsen, die durch die Quadratwurzeln der jeweiligen Eigenwerte skaliert werden. Dann gilt der Satz, auf den Sie sich beziehen.
In der Tat, wenn die Eigenzerlegung der Korrelationsmatrix wobei Eigenvektoren (Hauptachsen) sind und eine diagonale Matrix von Eigenwerten ist, und Wenn wir Ladungen als kann man leicht sehen, dassDarüber hinaus ist die beste Rang ist Annäherung an die Korrelationsmatrix von dem ersten gegebenen PCA Beladungen:
Weitere Informationen zur Rekonstruktion von Kovarianzmatrizen mit Faktoranalyse und PCA-Ladungen finden Sie in meiner Antwort hier .
quelle