Die Faktoranalyse ist im Wesentlichen ein (eingeschränktes) lineares Regressionsmodell. In diesem Modell ist jede analysierte Variable die abhängige Variable, gemeinsame Faktoren sind die IVs und der implizite eindeutige Faktor dient als Fehlerterm. (Der konstante Term wird aufgrund von Zentrierung oder Standardisierung, die bei der Berechnung von Kovarianzen oder Korrelationen impliziert sind, auf Null gesetzt.) Genau wie bei der linearen Regression könnte es also eine "starke" Annahme der Normalität geben - IVs (gemeinsame Faktoren) sind multivariate Normalen und Fehler (eindeutiger Faktor) sind normal, was automatisch dazu führt, dass der DV normal ist; und "schwache" Annahme der Normalität - Fehler (eindeutiger Faktor) sind nur normal, daher muss der DV nicht normal sein. Sowohl in der Regression als auch in der FA geben wir normalerweise eine "schwache" Annahme zu, weil sie realistischer ist.
Unter den klassischen FA-Extraktionsmethoden gibt nur die Maximum-Likelihood-Methode an, dass die analysierten Variablen multivariat normal sind, da sie von den Merkmalen der Population abweichen. Methoden wie Hauptachsen oder minimale Residuen erfordern diese "starke" Annahme nicht (obwohl Sie sie trotzdem machen können).
Bitte denken Sie daran, dass selbst wenn Ihre Variablen separat normal sind, dies nicht unbedingt garantiert, dass Ihre Daten multivariat normal sind.
Akzeptieren wir die "schwache" Annahme der Normalität. Was ist dann die potenzielle Bedrohung durch stark verzerrte Daten wie Ihre? Es sind Ausreißer. Wenn die Verteilung einer Variablen stark asymmetrisch ist, hat der längere Schwanz einen zusätzlichen Einfluss auf die Berechnung von Korrelationen oder Kovarianzen und gleichzeitig die Besorgnis darüber, ob er immer noch dasselbe psychologische Konstrukt (den Faktor) misst wie der kürzere Schwanz. Es kann vorsichtig sein zu vergleichen, ob Korrelationsmatrizen, die auf der unteren Hälfte und der oberen Hälfte der Bewertungsskala aufgebaut sind, ähnlich sind oder nicht. Wenn sie ähnlich genug sind, können Sie daraus schließen, dass beide Schwänze dasselbe messen und Ihre Variablen nicht transformieren. Andernfalls sollten Sie eine Transformation oder eine andere Aktion in Betracht ziehen, um den Effekt des "Ausreißer" -Langschwanzes zu neutralisieren.
Transformationen sind reichlich. Zum Beispiel wird das Erhöhen auf eine Potenz> 1 oder Exponentiation für Daten mit Linksversatz und Potenz <1 oder Logarithmus - für Daten mit Rechtsversatz verwendet. Meine eigene Erfahrung besagt, dass eine so genannte optimale Transformation über eine kategoriale PCA, die vor einer FA durchgeführt wurde, fast immer von Vorteil ist, da sie normalerweise zu klareren, interpretierbaren Faktoren in der FA führt. Unter der Annahme, dass die Anzahl der Faktoren bekannt ist, werden Ihre Daten nichtlinear transformiert, um die Gesamtvarianz dieser Anzahl von Faktoren zu maximieren.
Ich poste nur, was ich von Yong und Pearce (2013) gelernt habe.
Yong, AG & Pearce, S. (2013). Ein Leitfaden für Anfänger zur Faktoranalyse: Konzentration auf die explorative Faktoranalyse. Tutorials zu quantitativen Methoden für die Psychologie , 9 (2), 79-94. DOI: 10.20982 / tqmp.09.2.p079
quelle