Über die Verwendung der Schrägrotation nach PCA

9

Mit mehreren Statistikpaketen wie SAS, SPSS und R können Sie nach einer PCA eine Art Faktorrotation durchführen.

  1. Warum ist nach einer PCA eine Rotation notwendig?
  2. Warum sollten Sie nach einer PCA eine schräge Rotation anwenden, da das Ziel der PCA darin besteht, orthogonale Dimensionen zu erzeugen?
pbneau
quelle
Ich habe eine Frage gestellt, die die Notwendigkeit einer Faktorrotation nach PCA veranschaulicht, da PCA das voreingenommene Ergebnis liefert. Siehe stats.stackexchange.com/questions/6575/…
mbaitoff

Antworten:

8

Ich denke, es gibt unterschiedliche Meinungen oder Ansichten zu PCA, aber im Grunde denken wir oft daran, dass es sich entweder um eine Reduktionstechnik handelt (Sie reduzieren den Platz für Ihre Funktionen auf eine kleinere, oft viel "lesbarere", vorausgesetzt, Sie kümmern sich um die richtige Zentrierung / Standardisierung der PCA Daten, wenn sie benötigt werden) oder eine Möglichkeit, latente Faktoren zu konstruierenoder Dimensionen, die einen wesentlichen Teil der interindividuellen Streuung ausmachen (hier stehen die "Individuen" für die statistischen Einheiten, zu denen Daten gesammelt werden; dies können Land, Personen usw. sein). In beiden Fällen konstruieren wir lineare Kombinationen der ursprünglichen Variablen, die das Maximum der Varianz berücksichtigen (wenn sie auf die Hauptachse projiziert werden), vorbehaltlich einer Einschränkung der Orthogonalität zwischen zwei beliebigen Hauptkomponenten. Was nun beschrieben wurde, ist rein algebrisch oder mathematisch und wir betrachten es nicht als (generierendes) Modell, im Gegensatz zu dem, was in der Tradition der Faktoranalyse getan wird, wo wir einen Fehlerterm einfügen, um eine Art Messfehler zu berücksichtigen . Ich mag auch die Einführung von William Revelle in seinem bevorstehenden Handbuch zur angewandten Psychometrie mit R. (Kapitel 6), wenn wir die Struktur einer Korrelationsmatrix analysieren wollen, dann

Das erste [Ansatz, PCA] ist ein Modell, das die Korrelationsmatrix in Bezug auf das Produkt von Komponenten approximiert, wobei jede Komponente eine gewichtete lineare Summe der Variablen ist, das zweite Modell [Faktoranalyse] ist auch eine Approximation der Korrelationsmatrix durch das Produkt zweier Faktoren, aber die Faktoren darin werden eher als Ursachen als als Folgen der Variablen angesehen.

Mit anderen Worten, mit PCA drücken Sie jede Komponente (Faktor) als lineare Kombination der Variablen aus, während dies in FA die Variablen sind, die als lineare Kombination der Faktoren ausgedrückt werden. Es ist allgemein anerkannt, dass beide Methoden im Allgemeinen ziemlich ähnliche Ergebnisse liefern (siehe z. B. Harman, 1976 oder Catell, 1978), insbesondere im "idealen" Fall, in dem wir eine große Anzahl von Individuen und einen guten Verhältnisfaktor haben: Variablen (typischerweise variierend) zwischen 2 und 10, abhängig von den Autoren, die Sie berücksichtigen!). Dies liegt daran, dass durch Schätzen der Diagonalen in der Korrelationsmatrix (wie dies in FA erfolgt und diese Elemente als Kommunalitäten bekannt sind) die Fehlervarianz aus der Faktormatrix eliminiert wird. Dies ist der Grund, warum PCA häufig verwendet wird, um latente Faktoren oder psychologische Konstrukte anstelle von FA aufzudecken, die im letzten Jahrhundert entwickelt wurden. Auf diesem Weg möchten wir jedoch häufig eine einfachere Interpretation der resultierenden Faktorstruktur (oder der sogenannten Mustermatrix) erreichen. Und dann kommt der nützliche Trick, die Fakultätsachse so zu drehen, dass wir die Belastung von Variablen mit einem bestimmten Faktor maximieren oder gleichwertig eine "einfache Struktur" erreichen. Durch orthogonale Rotation (z. B. VARIMAX) bewahren wir die Unabhängigkeit der Faktoren. Bei einer schrägen Rotation (z. B. OBLIMIN, PROMAX) brechen wir sie und Faktoren können korrelieren. Dies wurde in der Literatur weitgehend diskutiert und hat einige Autoren (nicht Psychometriker, sondern Statistiker Anfang der 1960er Jahre) angeführt. '

Der Punkt ist jedoch, dass Rotationsmethoden ursprünglich im Rahmen des FA-Ansatzes entwickelt wurden und jetzt routinemäßig mit PCA verwendet werden. Ich denke nicht, dass dies der algorithmischen Berechnung der Hauptkomponenten widerspricht: Sie können Ihre Fakultätsachsen nach Ihren Wünschen drehen, vorausgesetzt, Sie berücksichtigen, dass die Interpretation des Fakultätsraums nach der Korrelation (durch Schrägdrehung) weniger offensichtlich wird.

PCA wird routinemäßig bei der Entwicklung neuer Fragebögen verwendet, obwohl FA in diesem Fall wahrscheinlich ein besserer Ansatz ist, da wir versuchen, aussagekräftige Faktoren zu extrahieren, die Messfehler berücksichtigen und deren Beziehungen möglicherweise selbst untersucht werden (z. B. durch Ausklammern des resultierenden Musters) Matrix erhalten wir ein Faktormodell zweiter Ordnung). PCA wird aber auch zur Überprüfung der Fakultätsstruktur bereits validierter verwendet. Forscher sind nicht wirklich wichtig für FA vs. PCA, wenn sie 500 repräsentative Probanden haben, die gebeten werden, einen 60-Punkte-Fragebogen zu fünf Dmensionen zu bewerten (dies ist der Fall beim NEO-FFI)zum Beispiel), und ich denke, sie haben Recht, weil wir in diesem Fall nicht sehr daran interessiert sind, ein generierendes oder konzeptionelles Modell zu identifizieren (der Begriff "repräsentativ" wird hier verwendet, um das Problem der Messinvarianz zu lindern ).

In Bezug auf die Wahl der Rotationsmethode und warum einige Autoren gegen die strikte Verwendung der orthogonalen Rotation argumentieren, möchte ich Paul Kline zitieren, wie ich es als Antwort auf die folgende Frage getan habe : FA: Auswahl der Rotationsmatrix, basierend auf „Einfache Struktur Kriterien “ ,

(...) In der realen Welt ist es nicht unangemessen zu glauben, dass Faktoren als wichtige Determinanten des Verhaltens miteinander korrelieren würden. - P. Kline, Geheimdienst. The Psychometric View , 1991, p. 19

Ich würde daher zu dem Schluss kommen, dass Sie je nach Ziel Ihrer Studie (möchten Sie die Hauptmuster Ihrer Korrelationsmatrix hervorheben oder eine vernünftige Interpretation der zugrunde liegenden Mechanismen liefern, die Sie möglicherweise veranlasst haben, eine solche Korrelationsmatrix zu beobachten ) müssen Sie die am besten geeignete Methode auswählen: Dies hat nicht mit der Konstruktion linearer Kombinationen zu tun, sondern lediglich mit der Art und Weise, wie Sie den resultierenden Fakultätsraum interpretieren möchten.

Verweise

  1. Harman, HH (1976). Moderne Faktorenanalyse . Chicago, University of Chicago Press.
  2. Cattell, RB (1978). Die wissenschaftliche Verwendung der Faktoranalyse . New York, Plenum.
  3. Kline, P. (1991). Intelligenz. Die psychometrische Sicht . Routledge.
chl
quelle
4

Das Problem bei orthogonalen Abmessungen besteht darin, dass die Komponenten nicht interpretierbar sein können. Während eine schräge Drehung (dh nichtorthogonale Abmessungen) technisch weniger zufriedenstellend ist, verbessert eine solche Drehung manchmal die Interpretierbarkeit der resultierenden Komponenten.


quelle
4

Grundlegende Punkte

  • Durch Drehen kann die Interpretation von Komponenten klarer werden
  • Eine schräge Rotation ist oft theoretischer sinnvoll. Das heißt, beobachtete Variablen können durch eine geringere Anzahl korrelierter Komponenten erklärt werden.

Beispiel

  • 10 testet alle Messfähigkeiten mit einigen verbalen und einigen räumlichen Messfähigkeiten. Alle Tests sind interkorreliert, aber die Interkorrelationen innerhalb verbaler oder räumlicher Tests sind größer als zwischen den Testtypen. Eine sparsame PCA kann zwei korrelierte Komponenten umfassen, eine verbale und eine räumliche. Theorie und Forschung legen nahe, dass diese beiden Fähigkeiten miteinander korrelieren. Eine schräge Drehung ist also theoretisch sinnvoll.
Jeromy Anglim
quelle