Hintergrund: Ich habe Hunderte von Teilnehmern meiner Umfrage gefragt, wie sehr sie an ausgewählten Bereichen interessiert sind (nach fünf Punkten Likert-Skalen, wobei 1 "nicht interessiert" und 5 "interessiert" bedeutet).
Dann habe ich PCA ausprobiert. Das Bild unten ist eine Projektion in die ersten beiden Hauptkomponenten. Farben werden für Geschlechter verwendet und PCA-Pfeile sind Originalvariablen (dh Interessen).
Ich habe bemerkt, dass:
- Punkte (Befragte) sind durch die zweite Komponente recht gut getrennt.
- Keine Pfeilspitzen mehr.
- Einige Pfeile sind viel kürzer als andere.
- Variablen neigen dazu, Cluster zu bilden, aber keine Beobachtungen.
- Es scheint, dass nach unten zeigende Pfeile (zu Männern) hauptsächlich die Interessen von Männern sind und Pfeile, die nach oben zeigen, hauptsächlich die Interessen von Frauen sind.
- Einige Pfeile zeigen weder nach unten noch nach oben.
Fragen: Wie kann man die Beziehungen zwischen Punkten (Befragten), Farben (Geschlecht) und Pfeilen (Variablen) richtig interpretieren? Welche anderen Schlussfolgerungen über die Befragten und ihre Interessen können aus dieser Verschwörung gezogen werden?
Die Daten finden Sie hier .
Antworten:
Die Punkte sind die Befragten und die Farben sind die Geschlechter. Das weißt du? Die Hauptachsen Ihres Diagramms stellen die ersten und zweiten PC-Ergebnisse dar, und Einzelpersonen werden auf dieser Basis dargestellt. Jemand im unteren linken Quadranten erhielt bei beiden niedrige Punktzahlen. PC2 scheint "männliche" und "weibliche" Interessen zu kennzeichnen. Ich weiß nicht, was PC1 bedeutet, aber es stellt wahrscheinlich eine Gesamtinteressenbewertung dar - Menschen mit vielen Interessen erzielen eine hohe Punktzahl. Oder vielleicht repräsentiert es Menschen mit leidenschaftlichen Interessen (Punktzahl 5).
Die Vektoren sind ein projiziertes Koordinatensystem für die ursprünglichen Variablen. Wenn Sie also einen Punkt senkrecht auf den Lesevektor projizieren, sollten Sie die Lesewertung dieser Person erhalten. Die relative Position ist hier wichtig.
Nehmen Sie einen "männlichen" Vektor wie "Adrenalinsport". Stellen Sie sich nun vor, Sie projizieren einen rosa Fleck von oben im oberen rechten Quadranten darauf. Die Koordinate dieser Person für "Adrenalinsport" ist negativ.
Warum befinden sich die Pfeile in der rechten Hälfte des Diagramms? Je tiefer eine Person in der linken Seite des Diagramms ist, desto weniger ihrer Projektionen sind positiv. Dies legt nahe, dass PC1 ein Maß für das Gesamtinteresse ist.
Ich bin mir nicht sicher, was Sie hier noch lernen könnten. Vielleicht möchten Sie sich PC3 und PC4 ansehen, wenn PC1 und PC2 Ihnen nur sagen, dass einige Menschen mehr Interessen haben als andere und dass Männer sich von Frauen unterscheiden.
Ihre Darstellung scheint um die PC1-Achse nahezu symmetrisch und in Bezug auf das Geschlecht symmetrisch zu sein. So viele Männer haben weibliche Interessen wie Frauen männliche Interessen ... oder stimmt das? Ich schaue nur auf die Punkte. Es könnte interessant sein, Bereiche zu betrachten, in denen die Karte nicht symmetrisch ist: großer PC1, mäßig negativer PC2 - dieser Sektor hat viel Action. Warum?
quelle