Faktoranalyse verstehen

8

Kann ich die Faktorenanalyse folgendermaßen verstehen?

Angenommen, ich habe 5 unabhängige Variablen (A, B, C, D, E)

Die Faktorenanalyse ermöglicht es mir, (D, E) zu abhängigen Variablen zu machen und sie zu linearen Kombinationen von (A, B, C) zu machen.

Daher muss ich nur (A, B, C) Daten und die Matrix tragen, dann kann ich Daten (D, E) durch Daten (A, B, C) und die Matrix neu erstellen .ΛΛ

Es wird nur Daten reduziert. Habe ich recht?

Marco
quelle
5
Ich habe diese Frage positiv bewertet, weil sie vernünftig ist. Gut gestellte Fragen, die Missverständnisse aufdecken, sollten begrüßt (und positiv bewertet, um dies anzuzeigen) und nicht durch negative Stimmen herabgesetzt werden, da sie zu großartigen Antworten führen können, wie sie @StasK hier bereits angeboten hat.
whuber

Antworten:

18

Nein. Bei der Faktoranalyse sind alle Variablen abhängige Variablen und hängen von latenten Faktoren ab (und enthalten auch Messfehler). Während Faktor-Scores häufig anstelle der ursprünglichen Variablen verwendet werden, was wie ein Problem bei der Datenreduktion erscheinen mag, ist genau dies das Ziel der Faktoranalyse. Mit anderen Worten, anstatt zu sagen: "Wow, ich habe viele Daten, die ich nicht wirklich verarbeiten und verstehen kann. Kann ich einen Trick finden, um weniger Variablen zu haben?", Wird die Faktoranalyse normalerweise in der Situation durchgeführt. " Ich kann eine Sache nicht direkt messen, also werde ich verschiedene Ansätze ausprobieren, ich weiß, dass ich viele Daten haben werde, aber dies wären verwandte Daten bekannter Struktur, und ich werde diese Struktur nutzen können, um etwas über diese Sache zu lernen dass ich nicht direkt messen konnte ".

Was Sie beschrieben haben, gilt entweder als multivariate Regression (nicht verwechseln mit multipler Regression, die eine abhängige Variable und viele erklärende Variablen umfasst; multivariate Regression hat viele abhängige Variablen und denselben Satz erklärender Variablen in jeder einzelnen Regression) oder als kanonische Korrelationen ( mit einem gewissen Maß an Vorstellungskraft) oder einem Modell mit mehreren Indikatoren und mehreren Ursachen für Strukturgleichungen. Aber nein, das ist keine Faktorenanalyse.

StasK
quelle
1

Um die hervorragende Antwort von @ StasK zu ergänzen, werde ich weiter klarstellen, dass dieses Problem unter den allgemeinen Dach der Strukturgleichungsmodellierung (SEM) fällt . SEM ist eine Technik, die zur Modellierung von Kovarianzstrukturen verwendet werden kann und, obwohl sie typischerweise mit nicht beobachteten oder latenten Variablen verwendet wird, auch auf Modelle mit nur beobachteten oder manifestierten Variablen angewendet werden kann. Wenn Sie die SEM-Methodik und -Terminologie auf Ihr Problem anwenden, werden D und E als endogene Variablen betrachtet, während A, B und C exogene Variablen sind. Die Endogenität legt nahe, dass die Varianz in der bestimmten Variablen durch eine andere Variable erklärt wird, während die Exogenität darauf hindeutet, dass die Varianz nicht durch eine andere Variable, latent oder manifest, erklärt wird.

werner Wothke bietet einige gute Folien Einführung SEM mit SAS hier .

Suchen Sie auch nach der Website von ed rigdon, auf der verschiedene SEM-Probleme besprochen werden (zu neu, kann nicht verlinkt werden!).

Zurück zu den Grundlagen: Wenn Sie die Faktoranalyse verstehen möchten, würde ich vorschlagen, mit einem angewandten Text wie Browns Bestätigungsfaktoranalyse für angewandte Forschung zu beginnen .

allinonemove
quelle
1
Die Seite von Ed Rigdon ist www2.gsu.edu/~mkteer . Um diese Antwort noch vollständiger zu machen, möchte ich hinzufügen, dass SEM mit beobachteten Variablen erst in den 1950er Jahren unter dem Titel simultaner Gleichungsmodelle erstmals in der Ökonometrie untersucht wurden. Ken Bollens ausgezeichnetes Buch ( amazon.com/Structural-Equations-Latent-Variables-Kenneth/dp/… ) ist tatsächlich eines der wenigen Bücher über SEM, das es ausführlich genug behandelt, um etwas Nützliches zu lernen.
StasK