Kann mir jemand bei der Interpretation von PCA-Scores helfen? Meine Daten stammen aus einem Fragebogen zur Einstellung gegenüber Bären. Nach den Ladungen habe ich eine meiner Hauptkomponenten als "Angst vor Bären" interpretiert. Würden sich die Bewertungen dieser Hauptkomponente darauf beziehen, wie jeder Befragte diese Hauptkomponente bewertet (ob er / sie positiv / negativ bewertet)?
16
Antworten:
Grundsätzlich werden die Faktorwerte als die mit den Faktorladungen gewichteten Rohantworten berechnet. Sie müssen sich also die Faktorladungen Ihrer ersten Dimension ansehen, um zu sehen, wie sich jede Variable auf die Hauptkomponente bezieht. Die Beobachtung hoher positiver (bzw. negativer) Belastungen in Verbindung mit bestimmten Variablen bedeutet, dass diese Variablen einen positiven (bzw. negativen) Beitrag zu dieser Komponente leisten. Daher haben Personen, die mit diesen Variablen hohe Punktzahlen erzielen, in dieser bestimmten Dimension tendenziell höhere (bzw. niedrigere) Faktorwerte.
Das Zeichnen des Korrelationskreises ist nützlich, um eine allgemeine Vorstellung von den Variablen zu erhalten, die "positiv" vs. "negativ" (falls vorhanden) zur ersten Hauptachse beitragen. Wenn Sie jedoch R verwenden, können Sie sich das FactoMineR- Paket und anschauen die
dimdesc()
Funktion.Hier ist ein Beispiel mit den
USArrests
Daten:Wie aus dem jüngsten Ergebnis hervorgeht, handelt es sich bei der ersten Dimension hauptsächlich um Gewaltakte (jeglicher Art). Wenn wir uns die einzelne Karte ansehen, ist es klar, dass sich rechts Staaten befinden, in denen solche Handlungen am häufigsten vorkommen.
Diese verwandte Frage könnte Sie auch interessieren: Was sind Hauptkomponentenbewertungen?
quelle
PCA-Scores sind für mich lediglich eine Neuanordnung der Daten in einer Form, mit der ich den Datensatz mit weniger Variablen erklären kann. Die Bewertungen geben an, inwieweit sich die einzelnen Elemente auf die Komponente beziehen. Sie können sie gemäß der Faktoranalyse benennen, aber es ist wichtig zu beachten, dass es sich nicht um latente Variablen handelt, da PCA alle Varianz im Datensatz analysiert, nicht nur die gemeinsam gehaltenen Elemente (wie dies bei der Faktoranalyse der Fall ist).
quelle
PCA-Ergebnisse (die verschiedenen Dimensionen oder Komponenten) können im Allgemeinen nicht in ein reales Konzept übersetzt werden. Ich denke, es ist falsch anzunehmen, dass eine der Komponenten "Angst vor Bären" ist. Die Prozedur "Hauptkomponenten" wandelt Ihre Datenmatrix in eine neue Datenmatrix mit der gleichen oder einer geringeren Anzahl von Dimensionen um. Die resultierenden Dimensionen reichen von einer, die die Varianz besser erklärt, bis zu einer, die sie weniger erklärt. Diese Komponenten werden basierend auf einer Kombination der ursprünglichen Variablen mit den berechneten Eigenvektoren berechnet. Bei der allgemeinen PCA-Prozedur werden die ursprünglichen Variablen in orthogonale (linear unabhängige) Variablen konvertiert. Ich hoffe, dies hilft Ihnen dabei, ein wenig über die Prozedur von pca zu klären
quelle