Ich möchte eine Hauptkomponentenanalyse (Faktoranalyse) auf SPSS basierend auf 22 Variablen durchführen. Einige meiner Variablen sind jedoch sehr verzerrt (die aus SPSS berechnete Schiefe liegt zwischen 2 und 80!).
Also hier sind meine Fragen:
Sollte ich die verzerrten Variablen so beibehalten oder könnte ich die Variablen bei der Hauptkomponentenanalyse transformieren? Wenn ja, wie würde ich Faktorwerte interpretieren?
Welche Art von Transformation soll ich tun? log10 oder ln?
Ursprünglich ist mein KMO (Kaiser-Meyer-Olkin) 0,413. In der Literatur wird ein Minimum von 0,5 empfohlen. Kann ich trotzdem eine Faktoranalyse durchführen oder muss ich Variablen entfernen, um mein KMO auf 0,5 zu erhöhen?
Antworten:
Das Skewness-Problem bei PCA ist dasselbe wie bei der Regression: Der längere Schwanz verhält sich, wenn er im Verhältnis zum gesamten Verteilungsbereich wirklich lang ist, tatsächlich wie ein großer Ausreißer - er zieht die Anpassungslinie (in Ihrem Fall die Hauptkomponente) stark in Richtung selbst, weil sein Einfluss verstärkt wird; sein Einfluss wird verstärkt, weil er so weit vom Mittelwert entfernt ist. Im Zusammenhang mit PCA ist das Zulassen sehr verzerrter Variablen dem Ausführen von PCA ohne Zentrieren der Daten ziemlich ähnlich (dh Ausführen von PCA auf der Basis einer Kosinusmatrix anstelle einer Korrelationsmatrix). Sie entscheiden, ob der lange Schwanz die Ergebnisse so stark beeinflussen soll (und die Daten sein lassen soll) oder nicht (und die Daten transformieren). Das Problem hängt nicht damit zusammen, wie Sie Ladungen interpretieren.
Wie es Dir gefällt.
KMO ist ein Index, der angibt, ob Teilkorrelationen relativ klein sind, um Daten an die Faktoranalyse zu senden. Weil wir in der Faktoranalyse im Allgemeinen erwarten, dass ein Faktor mehr als nur zwei Variablen lädt . Ihr KMO ist niedrig genug. Sie können es verbessern, wenn Sie die Analysevariablen mit niedrigen individuellen KMO-Werten verlassen (diese bilden die Diagonale der Anti-Bild- Matrix. Sie können anfordern, diese Matrix im SPSS-Faktor-Verfahren anzuzeigen). Kann die Umwandlung von Variablen in weniger verzerrte KMO wiederhergestellt werden? Wer weiß. Vielleicht. Beachten Sie, dass KMO hauptsächlich im Faktoranalysemodell wichtig ist, nicht im Hauptkomponentenanalysemodell: In FA passen Sie paarweise Korrelationen an, in PCA dagegen nicht.
quelle
+1 bis @ttnphns, ich möchte nur ein wenig auf Punkt 2 eingehen. Transformationen werden häufig verwendet, um den Versatz zu stabilisieren. Wie @ttnphns hervorhebt, würden Sie diese verwenden, bevor Sie Ihre Analysen ausführen. Protokolltransformationen sind Teil der Box-Cox-Familie von Leistungstransformationen. Sie sollten einen größeren Bereich möglicher Transformationen berücksichtigen als nur Protokolle (z. B. Quadratwurzel, Kehrwert usw.). Die Wahl zwischen verschiedenen logarithmischen Basen hat keinen Einfluss auf die Stärke der Transformation. Wenn Menschen mathematisch mit der transformierten Variablen arbeiten, werden manchmal natürliche Protokolle bevorzugt, da das natürliche Protokoll in einigen Fällen für eine sauberere Mathematik sorgen kann. Wenn Sie sich nicht darum kümmern, möchten Sie möglicherweise eine Basis auswählen, die die Interpretation erleichtert. Das heißt, jede Erhöhung der Einheit in der neuen Skala stellt eine Basis dar-fache Erhöhung der ursprünglichen Skala (z. B. wenn Sie Log Base 2 verwenden, wäre jede Einheit eine 2-fache Erhöhung, Base 10 bedeutet, dass jede Einheit eine 10-fache Erhöhung wäre usw.), also kann es schön sein um eine Basis so auszuwählen, dass Ihre Daten mehrere Einheiten in der transformierten Skala umfassen.
quelle