Interpretation der PCA-Ergebnisse

16

Kann mir jemand bei der Interpretation von PCA-Scores helfen? Meine Daten stammen aus einem Fragebogen zur Einstellung gegenüber Bären. Nach den Ladungen habe ich eine meiner Hauptkomponenten als "Angst vor Bären" interpretiert. Würden sich die Bewertungen dieser Hauptkomponente darauf beziehen, wie jeder Befragte diese Hauptkomponente bewertet (ob er / sie positiv / negativ bewertet)?

mdewey
quelle
Die kurze Antwort auf Ihre Frage lautet JA.
Amöbe sagt Reinstate Monica

Antworten:

13

Grundsätzlich werden die Faktorwerte als die mit den Faktorladungen gewichteten Rohantworten berechnet. Sie müssen sich also die Faktorladungen Ihrer ersten Dimension ansehen, um zu sehen, wie sich jede Variable auf die Hauptkomponente bezieht. Die Beobachtung hoher positiver (bzw. negativer) Belastungen in Verbindung mit bestimmten Variablen bedeutet, dass diese Variablen einen positiven (bzw. negativen) Beitrag zu dieser Komponente leisten. Daher haben Personen, die mit diesen Variablen hohe Punktzahlen erzielen, in dieser bestimmten Dimension tendenziell höhere (bzw. niedrigere) Faktorwerte.

Das Zeichnen des Korrelationskreises ist nützlich, um eine allgemeine Vorstellung von den Variablen zu erhalten, die "positiv" vs. "negativ" (falls vorhanden) zur ersten Hauptachse beitragen. Wenn Sie jedoch R verwenden, können Sie sich das FactoMineR- Paket und anschauen die dimdesc()Funktion.

Hier ist ein Beispiel mit den USArrestsDaten:

> data(USArrests)
> library(FactoMineR)
> res <- PCA(USArrests)
> dimdesc(res, axes=1)  # show correlation of variables with 1st axis
$Dim.1
$Dim.1$quanti
         correlation  p.value
Assault        0.918 5.76e-21
Rape           0.856 2.40e-15
Murder         0.844 1.39e-14
UrbanPop       0.438 1.46e-03
> res$var$coord  # show loadings associated to each axis
         Dim.1  Dim.2  Dim.3   Dim.4
Murder   0.844 -0.416  0.204  0.2704
Assault  0.918 -0.187  0.160 -0.3096
UrbanPop 0.438  0.868  0.226  0.0558
Rape     0.856  0.166 -0.488  0.0371

Wie aus dem jüngsten Ergebnis hervorgeht, handelt es sich bei der ersten Dimension hauptsächlich um Gewaltakte (jeglicher Art). Wenn wir uns die einzelne Karte ansehen, ist es klar, dass sich rechts Staaten befinden, in denen solche Handlungen am häufigsten vorkommen.

Alt-Text Alt-Text

Diese verwandte Frage könnte Sie auch interessieren: Was sind Hauptkomponentenbewertungen?

chl
quelle
5

PCA-Scores sind für mich lediglich eine Neuanordnung der Daten in einer Form, mit der ich den Datensatz mit weniger Variablen erklären kann. Die Bewertungen geben an, inwieweit sich die einzelnen Elemente auf die Komponente beziehen. Sie können sie gemäß der Faktoranalyse benennen, aber es ist wichtig zu beachten, dass es sich nicht um latente Variablen handelt, da PCA alle Varianz im Datensatz analysiert, nicht nur die gemeinsam gehaltenen Elemente (wie dies bei der Faktoranalyse der Fall ist).

richiemorrisroe
quelle
Ja, Sie haben Recht, wenn Sie sagen, dass im Gegensatz zu FA in PCA kein Fehlermodell enthalten ist. Ich habe +1 für diesen bestimmten Punkt. Beachten Sie, dass ich sagte "es ist sinnvoll zu berücksichtigen", nicht, dass die aus PCA extrahierten Hauptkomponenten echte LVs sind. Sofern Sie nicht daran interessiert sind, die Zuverlässigkeit von Maßstäben oder Messmodelle zu beurteilen, spielt es jedoch keine Rolle, ob Sie PCA oder FA verwenden. Bei der Datenanalyse geht es häufig darum, die Korrelation zwischen Variablen zu erklären oder Gruppen von Subjekten zu finden, daher die Idee , eine oder mehrere Dimensionen des Fakultätsraums zu interpretieren . (...)
Chl
(...) Der FactoMineR enthält einen Datensatz über Weine, und es können viele Faktorenmethoden verwendet werden, um damit zu spielen (PCA, MFA), und sogar PLS oder CCA, wie dies von Michel Tenenhaus getan wurde.
Chl
@ chl, Danke für den Hinweis auf das Paket, ich werde das überprüfen. In PCA vs FA stimme ich bis zu einem gewissen Punkt zu. Ich bevorzuge FA für die meisten Anwendungen, da ich die Schätzungen der Kommunalität (der gemeinsamen Varianz) als sehr nützlich bei der Bewertung des Werts einer bestimmten Faktorstruktur einschätze. Dies kann jedoch nur eine persönliche Präferenz sein.
Richiemorrisroe
Sie haben vollkommen recht (ich habe Ihre frühere Antwort bereits positiv bewertet, weil sie sehr deutlich gemacht wurde). Es ist nur so, dass (nicht gedrehte) PCA zusammen mit CA, MFA, MCA eine eigene Geschichte in der Datenanalyse hat (insbesondere die französische Schule). Andererseits hat Paul Kline zwei sehr schöne Bücher über die Verwendung von FA in der Persönlichkeitsforschung. Und das kommende Buch von William Revelle sollte für R-Benutzer rocken :) Nun, auf jeden Fall sind wir uns einig, dass dies nützliche Werkzeuge sind, um die Struktur einer Korrelationsmatrix zu analysieren.
Chl
0

PCA-Ergebnisse (die verschiedenen Dimensionen oder Komponenten) können im Allgemeinen nicht in ein reales Konzept übersetzt werden. Ich denke, es ist falsch anzunehmen, dass eine der Komponenten "Angst vor Bären" ist. Die Prozedur "Hauptkomponenten" wandelt Ihre Datenmatrix in eine neue Datenmatrix mit der gleichen oder einer geringeren Anzahl von Dimensionen um. Die resultierenden Dimensionen reichen von einer, die die Varianz besser erklärt, bis zu einer, die sie weniger erklärt. Diese Komponenten werden basierend auf einer Kombination der ursprünglichen Variablen mit den berechneten Eigenvektoren berechnet. Bei der allgemeinen PCA-Prozedur werden die ursprünglichen Variablen in orthogonale (linear unabhängige) Variablen konvertiert. Ich hoffe, dies hilft Ihnen dabei, ein wenig über die Prozedur von pca zu klären

mariana weicher
quelle
Würden Sie zustimmen, dass eine lineare Kombination einiger Variablen immer noch so interpretiert werden kann, dass sie einen gewichteten Beitrag jedes einzelnen zur Faktorachse widerspiegelt?
Chl
Ja, genau das ist es.
Mariana Soffer
Warum also verhindern, dass es einen Namen bekommt? Variablen werden nur als Manifestvariablen betrachtet, und in einigen Fällen ist es sinnvoll, ihre gewichtete Kombination so zu betrachten, dass sie einen latenten (nicht beobachteten) Faktor widerspiegelt.
Chl