Sind Datentransformationen für nicht normale Daten für eine explorative Faktoranalyse erforderlich, wenn die Extraktionsmethode des Hauptachsenfaktors verwendet wird?

9

Ich entwickle einen Fragebogen, um vier Faktoren zu messen, die Spiritualität ausmachen, und ich möchte die folgende Frage stellen:

Sind Datentransformationen für nicht normale Daten für eine explorative Faktoranalyse erforderlich, wenn die Extraktionsmethode des Hauptachsenfaktors verwendet wird?

Ich habe gestern das Screening meiner Daten beendet und festgestellt, dass 3 von 20 Fragen positiv verzerrt sind, während 1 von 20 negativ verzerrt ist (Frage 6 = 4,88, Frage 9 = 7,22, Frage 12 = 11,11, Frage 16 = -6,26). Ich fand auch, dass 1 der Fragen (von 20) leptokurtisch ist (Frage 12 = 12,21).

Ich habe die Extraktionsmethode für das Faktorisieren der Hauptachse gewählt, weil ich gelesen habe, dass sie für "stark nicht normale Daten" verwendet wird, während die maximale Wahrscheinlichkeit für normale Daten verwendet wird, aber:

  1. Wie würde ich wissen, ob meine Daten "stark" nicht normal sind?

  2. Wenn meine Daten "stark nicht normal" sind, bedeutet dies, dass ich die Daten so lassen kann, wie sie jetzt sind (nicht transformieren) und sie mit der Extraktionsmethode des Hauptachsenfaktors analysieren kann? Oder muss ich die Daten transformieren, bevor ich mit der EFA fortfahren kann?

  3. Wenn ich die Daten transformieren muss, welche Transformationen würde ich für positiv verzerrte, negativ verzerrte und leptokurtische Elemente verwenden?

Madeline
quelle

Antworten:

10

Die Faktoranalyse ist im Wesentlichen ein (eingeschränktes) lineares Regressionsmodell. In diesem Modell ist jede analysierte Variable die abhängige Variable, gemeinsame Faktoren sind die IVs und der implizite eindeutige Faktor dient als Fehlerterm. (Der konstante Term wird aufgrund von Zentrierung oder Standardisierung, die bei der Berechnung von Kovarianzen oder Korrelationen impliziert sind, auf Null gesetzt.) Genau wie bei der linearen Regression könnte es also eine "starke" Annahme der Normalität geben - IVs (gemeinsame Faktoren) sind multivariate Normalen und Fehler (eindeutiger Faktor) sind normal, was automatisch dazu führt, dass der DV normal ist; und "schwache" Annahme der Normalität - Fehler (eindeutiger Faktor) sind nur normal, daher muss der DV nicht normal sein. Sowohl in der Regression als auch in der FA geben wir normalerweise eine "schwache" Annahme zu, weil sie realistischer ist.

Unter den klassischen FA-Extraktionsmethoden gibt nur die Maximum-Likelihood-Methode an, dass die analysierten Variablen multivariat normal sind, da sie von den Merkmalen der Population abweichen. Methoden wie Hauptachsen oder minimale Residuen erfordern diese "starke" Annahme nicht (obwohl Sie sie trotzdem machen können).

Bitte denken Sie daran, dass selbst wenn Ihre Variablen separat normal sind, dies nicht unbedingt garantiert, dass Ihre Daten multivariat normal sind.

Akzeptieren wir die "schwache" Annahme der Normalität. Was ist dann die potenzielle Bedrohung durch stark verzerrte Daten wie Ihre? Es sind Ausreißer. Wenn die Verteilung einer Variablen stark asymmetrisch ist, hat der längere Schwanz einen zusätzlichen Einfluss auf die Berechnung von Korrelationen oder Kovarianzen und gleichzeitig die Besorgnis darüber, ob er immer noch dasselbe psychologische Konstrukt (den Faktor) misst wie der kürzere Schwanz. Es kann vorsichtig sein zu vergleichen, ob Korrelationsmatrizen, die auf der unteren Hälfte und der oberen Hälfte der Bewertungsskala aufgebaut sind, ähnlich sind oder nicht. Wenn sie ähnlich genug sind, können Sie daraus schließen, dass beide Schwänze dasselbe messen und Ihre Variablen nicht transformieren. Andernfalls sollten Sie eine Transformation oder eine andere Aktion in Betracht ziehen, um den Effekt des "Ausreißer" -Langschwanzes zu neutralisieren.

Transformationen sind reichlich. Zum Beispiel wird das Erhöhen auf eine Potenz> 1 oder Exponentiation für Daten mit Linksversatz und Potenz <1 oder Logarithmus - für Daten mit Rechtsversatz verwendet. Meine eigene Erfahrung besagt, dass eine so genannte optimale Transformation über eine kategoriale PCA, die vor einer FA durchgeführt wurde, fast immer von Vorteil ist, da sie normalerweise zu klareren, interpretierbaren Faktoren in der FA führt. Unter der Annahme, dass die Anzahl der Faktoren bekannt ist, werden Ihre Daten nichtlinear transformiert, um die Gesamtvarianz dieser Anzahl von Faktoren zu maximieren.

ttnphns
quelle
Danke für deine Antwort! Und würden Sie empfehlen, Frage 12 zu entfernen, da sie sowohl positiv verzerrt als auch leptokurtisch ist, oder wäre es besser, sie zu belassen und zu transformieren?
Madeline
Ich würde auf direkten Rat verzichten und nicht in Ihren Schuhen stecken. Im Allgemeinen sind chronisch sehr verzerrte (= zu schwierig oder zu einfach) oder leptokurtische (unempfindlich gegenüber Unterschieden zwischen typischen Befragten) Fragen psychometrisch "schlechte" Fragen, die es wert sind, überarbeitet zu werden.
ttnphns
1

Ich poste nur, was ich von Yong und Pearce (2013) gelernt habe.

Um eine Faktoranalyse durchzuführen, muss die Daten eine univariate und multivariate Normalität aufweisen (Child, 2006).

Yong, AG & Pearce, S. (2013). Ein Leitfaden für Anfänger zur Faktoranalyse: Konzentration auf die explorative Faktoranalyse. Tutorials zu quantitativen Methoden für die Psychologie , 9 (2), 79-94. DOI: 10.20982 / tqmp.09.2.p079

Chris Kelly
quelle