Ich möchte überprüfen, ob ich die [klassische, lineare] Faktoranalyse (FA) wirklich verstanden habe , insbesondere Annahmen , die vor (und möglicherweise nach) FA getroffen wurden.
Einige der Daten sollten anfänglich korreliert sein, und es besteht eine mögliche lineare Beziehung zwischen ihnen. Nach der Faktorenanalyse werden die Daten normal verteilt (bivariate Verteilung für jedes Paar) und es gibt keine Korrelation zwischen Faktoren (gemeinsam und spezifisch) und keine Korrelation zwischen Variablen eines Faktors und Variablen anderer Faktoren.
Ist es richtig?
Binary data should also be avoided
ja, für welche andere Methode zur Faktorenanalyse können wir noch vorgehenbinary data
?In den meisten Fällen wird die Faktoranalyse ohne statistische Tests an sich durchgeführt. Es ist viel subjektiver und interpretativer als Methoden wie Regression, Strukturgleichungsmodellierung und so weiter. Und im Allgemeinen sind es Inferenztests, die mit Annahmen einhergehen: Damit p- Werte und Konfidenzintervalle korrekt sind, müssen diese Annahmen erfüllt sein.
Wenn nun die Methode zur Auswahl der Anzahl der Faktoren als Maximum-Likelihood-Methode festgelegt ist, wird davon ausgegangen, dass die in die Faktoranalyse eingegebenen Variablen Normalverteilungen aufweisen.
Dass die Eingabevariablen Korrelationen ungleich Null aufweisen, ist insofern eine Art Annahme, dass die Ergebnisse der Faktoranalyse (wahrscheinlich) unbrauchbar sind, wenn sie nicht wahr sind: Kein Faktor wird als latente Variable hinter einem Satz von Eingabevariablen auftreten.
Soweit es "keine Korrelation zwischen Faktoren (allgemein und spezifisch) und keine Korrelation zwischen Variablen eines Faktors und Variablen anderer Faktoren" gibt, sind dies keine universellen Annahmen, die Faktoranalytiker treffen, obwohl sie manchmal entweder eine Bedingung (oder eine Annäherung) sind davon) könnte wünschenswert sein. Letzteres ist, wenn es gilt, als "einfache Struktur" bekannt.
Es gibt eine andere Bedingung, die manchmal als "Annahme" behandelt wird: dass die Korrelationen nullter Ordnung (Vanille) zwischen Eingabevariablen nicht durch große Teilkorrelationen überschwemmt werden. Kurz gesagt bedeutet dies, dass Beziehungen für einige Paarungen stark und für andere schwach sein sollten. Andernfalls sind die Ergebnisse "schlammig". Dies hängt mit der Wünschbarkeit einer einfachen Struktur zusammen und kann tatsächlich unter Verwendung der Kaiser-Meyer-Olkin-Statistik oder des KMO bewertet (obwohl nicht formal "getestet") werden. KMO-Werte in der Nähe von 0,8 oder 0,9 werden normalerweise als sehr vielversprechend für informative Faktorenanalyseergebnisse angesehen, während KMOs in der Nähe von 0,5 oder 0,6 viel weniger vielversprechend sind und Werte unter 0,5 einen Analysten möglicherweise dazu veranlassen, seine Strategie zu überdenken.
quelle
Annahmen, die der exploratorischen Faktoranalyse zugrunde liegen, sind:
• Intervall- oder Verhältnisniveau der Messung
• Zufallsstichprobe
• Beziehung zwischen beobachteten Variablen ist linear
• Eine Normalverteilung (jede beobachtete Variable)
• Eine bivariate Normalverteilung (jedes Paar beobachteter Variablen)
• Multivariate Normalität
Oben ab die SAS-Datei
quelle