Wie ist der „Fundamentalsatz der Faktoranalyse“ auf PCA anwendbar, oder wie sind PCA-Ladungen definiert?

14

Ich bin gerade dabei, ein Dia-Set für die "Faktoranalyse" zu durchlaufen (PCA, soweit ich das beurteilen kann).

Darin wird der "Fundamentalsatz der Faktoranalyse" abgeleitet, der besagt, dass die Korrelationsmatrix der in die Analyse Daten ( ) unter Verwendung der Matrix der Faktorladungen ( ) wiederhergestellt werden kann :RA

R=AA

Das verwirrt mich jedoch. In PCA ist die Matrix der "Faktorladungen" durch die Matrix der Eigenvektoren der Kovarianz / Korrelationsmatrix der Daten gegeben (da wir annehmen, dass die Daten standardisiert wurden, sind sie gleich), wobei jeder Eigenvektor skaliert ist, um zu haben Länge eins. Diese Matrix ist orthogonal, also AA=I was im Allgemeinen nicht gleich R .

user2249626
quelle
Sehen Sie sich zusätzlich zu @ amoebas Antwort meine Antwort an, die die terminologische Mehrdeutigkeit berücksichtigt. Ich empfehle Aaus Gründen der Klarheit nicht, die Eigenvektormatrix (die Ladungen sind) zu nennen . Die (rechte) Eigenvektormatrix ist normalerweise beschriftet V(weil R=USV'von svd), nicht A. Ein anderer äquivalenter Name (der aus der Biplot-Terminologie stammt) für Eigenvektoren ist "Standardkoordinaten" und für Ladungen "Hauptkoordinaten".
TTNPHNS
("Standardkoordinaten" - da die Trägheit oder die Skala der Eigenwerte beim Ausstatten die Einheitsgröße ist; "Hauptkoordinaten" - weil sie beim
Ausstatten die

Antworten:

17

Dies ist eine vernünftige Frage (+1), die sich aus der terminologischen Mehrdeutigkeit und Verwirrung ergibt.

Im Zusammenhang mit PCA werden Hauptachsen (Eigenvektoren der Kovarianz / Korrelationsmatrix) häufig als "Belastungen" bezeichnet. Dies ist eine schlampige Terminologie. Was in PCA eher als "Belastungen" bezeichnet werden sollte, sind Hauptachsen, die durch die Quadratwurzeln der jeweiligen Eigenwerte skaliert werden. Dann gilt der Satz, auf den Sie sich beziehen.

In der Tat, wenn die Eigenzerlegung der Korrelationsmatrix wobei Eigenvektoren (Hauptachsen) sind und eine diagonale Matrix von Eigenwerten ist, und Wenn wir Ladungen als kann man leicht sehen, dassDarüber hinaus ist die beste Rang ist Annäherung an die Korrelationsmatrix von dem ersten gegebenen PCA Beladungen:

R=VSV
VS
A=VS1/2,
R=AA.
rr
RArAr.

Weitere Informationen zur Rekonstruktion von Kovarianzmatrizen mit Faktoranalyse und PCA-Ladungen finden Sie in meiner Antwort hier .

Amöbe sagt Reinstate Monica
quelle