Befindet sich nach der PCA noch eine Rotation (z. B. Varimax)?

63

Ich habe versucht, einige Forschungen (mit PCA) von SPSS in R zu reproduzieren. Nach meiner Erfahrung war die principal() Funktion aus Paket psychdie einzige Funktion, die der Ausgabe entsprach (oder wenn mein Gedächtnis richtig funktioniert). Um die gleichen Ergebnisse wie in SPSS zu erzielen, musste ich parameter verwenden principal(..., rotate = "varimax"). Ich habe Zeitungen darüber sprechen sehen, wie sie PCA gemacht haben, aber basierend auf der Ausgabe von SPSS und der Verwendung von Rotation klingt es eher wie eine Faktoranalyse.

Frage: Ist PCA auch nach dem Drehen (mit varimax) noch PCA? Ich hatte den Eindruck, dass dies tatsächlich eine Faktorenanalyse sein könnte ... Falls nicht, welche Details fehlen mir?

Roman Luštrik
quelle
4
Technisch gesehen , was Sie nach der Rotation haben , sind nicht Hauptkomponenten mehr.
Gala
2
Die Drehung selbst ändert nichts daran. Gedreht oder nicht, die Analyse ist das, was sie ist. PCA ist nicht FA in der engen Definition von "Faktoranalyse" und PCA ist FA in einer breiteren Definition von "Faktoranalyse". stats.stackexchange.com/a/94104/3277
ttnphns
1
Hallo @Roman! Ich habe diesen alten Thread überprüft und bin überrascht, dass Sie Bretts Antwort als akzeptiert markiert haben. Sie haben gefragt, ob PCA + -Rotation immer noch PCA ist oder FA ist. Bretts Antwort sagt kein einziges Wort über Rotationen! Es wird auch nicht die principalFunktion erwähnt, nach der Sie gefragt haben. Wenn seine Antwort tatsächlich Ihre Frage beantwortet hat, ist Ihre Frage möglicherweise nicht angemessen formuliert. Würden Sie eine Bearbeitung in Betracht ziehen? Ansonsten ist die Antwort der Promotion meiner Meinung nach viel näher an der tatsächlichen Beantwortung Ihrer Frage. Beachten Sie, dass Sie die akzeptierte Antwort jederzeit ändern können.
Amöbe sagt Reinstate Monica
1
Ich sollte hinzufügen, dass ich an einer neuen, detaillierteren Antwort auf Ihre Frage arbeite. Daher bin ich gespannt, ob Sie sich tatsächlich noch für dieses Thema interessieren. Immerhin sind vier und Jahre vergangen ...
Amöbe sagt Reinstate Monica
3
@amoeba kann mir zukünftig leider nicht antworten, warum ich diese Antwort akzeptiert habe. Als ich das alte Biest 4,5 Jahre später überprüfte, stellte ich fest, dass keine der Antworten in die Nähe kam. mbq fängt vielversprechend an, ist aber unerklärlich. Aber egal, das Thema ist sehr verwirrend, wahrscheinlich dank falscher Terminologie in populärer Statistiksoftware für die Sozialwissenschaften, die ich nicht mit einer Abkürzung aus vier Buchstaben benennen werde. Bitte posten Sie eine Antwort und senden Sie mir einen Ping-Befehl. Ich akzeptiere diese, wenn ich meine Frage näher beantworten kann.
Roman Luštrik

Antworten:

53

Bei dieser Frage geht es hauptsächlich um Definitionen von PCA / FA, daher können sich die Meinungen unterscheiden. Meiner Meinung nach sollte PCA + varimax nicht als PCA oder FA bezeichnet werden, sondern eher explizit als "varimax-gedrehtes PCA" bezeichnet werden.

Ich sollte hinzufügen, dass dies ein ziemlich verwirrendes Thema ist. In dieser Antwort möchte ich erklären, was eine Rotation tatsächlich ist . Dies erfordert etwas Mathematik. Ein gelegentlicher Leser kann direkt zur Abbildung springen. Nur dann können wir diskutieren, ob PCA + Rotation als "PCA" bezeichnet werden soll oder nicht.

Eine Referenz ist Jolliffes Buch "Principal Component Analysis", Abschnitt 11.1 "Rotation von Hauptkomponenten", aber ich finde, es könnte klarer sein.


Sei eine n × p- Datenmatrix, von der wir annehmen, dass sie zentriert ist. PCA ergibt ( siehe meine Antwort hier ) eine Singulärwertzerlegung: X = U S V . Es gibt zwei äquivalente, aber komplementäre Ansichten zu dieser Zerlegung: eine eher PCA-artige "Projektions" -Ansicht und eine eher FA-artige "latente Variablen" -Ansicht.Xn×pX=USV

Gemäß der PCA-Stil - Ansicht, fanden wir eine Reihe von orthogonalen Richtungen (diese sind Eigenvektoren der Kovarianz - Matrix, die auch „Hauptrichtungen“ oder „Achsen“ bezeichnet), und „principal components“ U S (auch als Hauptbestandteil " Scores ") sind Projektionen der Daten in diese Richtungen. Hauptkomponenten sind unkorreliert, die erste hat maximal mögliche Varianz etc. kann man schreiben: X = U SV = Scores Hauptrichtungen .VUS

X=USV=ScoresHauptrichtungen.

Nach Ansicht des FA-Stils fanden wir einige unkorrelierte "latente Faktoren" der Einheitsvarianz, die über "Ladungen" zu den beobachteten Variablen führen. Tatsächlich ist sind standardisierte Hauptkomponenten (unkorreliert und mit Einheitsvarianz), und wenn wir Belastungen alsL=VS/ √ definierenU~=n-1U , dann ist X=L=VS/n-1(Beachten Sie, dass S=S ist.) Beide Ansichten sind äquivalent. Beachten Sie, dass Ladungen Eigenvektoren sind, die mit den jeweiligen Eigenwerten (S/

X=n1U(VS/n1)=U~L=Standardized scoresLoadings.
S=S sind Eigenwerte der Kovarianzmatrix.S/n1

(Ich sollte in Klammern hinzufügen, dass PCA FA ; FA explizit darauf abzielt, latente Faktoren zu finden, die über Ladevorgänge linear auf die beobachteten Variablen abgebildet werden. Es ist flexibler als PCA und liefert unterschiedliche Ladevorgänge. Aus diesem Grund ziehe ich es vor, das Obige zu bezeichnen. " FA-artige Ansicht auf PCA "und nicht FA, obwohl manche Leute es als eine der FA-Methoden ansehen.)

Was macht nun eine Rotation? ZB eine orthogonale Rotation wie Varimax. Erstens, es hält nur Komponenten, dh: XU k S k V k = ~ U k L k . Dann nimmt man eine quadratische orthogonale k × k- Matrix T und setzt T T = I in diese Zerlegung ein: XU k S k V k = Uk<p

XUkSkVk=U~kLk.
k×kTTT=ich wobei gedrehte Belastungen durch L r o t = L k T gegeben sind und gedrehte standardisierte Bewertungen durch ˜ U r o t = ˜ gegeben sind U k T . (Ziel ist es, T sozu finden, dass L r o t
XUkSkVk=UkTTSkVk=U~rOtLrOt,
LrOt=LkTU~rOt=U~kTTLrOt wurde so knapp wie möglich, um seine Interpretation zu erleichtern.)

Es ist zu beachten, dass Folgendes gedreht wird: (1) standardisierte Bewertungen, (2) Ladungen. Aber nicht die rohen Noten und nicht die Hauptrichtungen! Die Rotation findet also im latenten Raum statt, nicht im ursprünglichen Raum. Das ist absolut entscheidend.

Aus Sicht des FA-Stils ist nicht viel passiert. (A) Die latenten Faktoren sind immer noch unkorreliert und standardisiert. (B) Sie werden weiterhin über (gedrehte) Ladungen auf die beobachteten Variablen abgebildet. (C) Die Menge der Varianz von jeder Komponente / Faktor erfaßt wird durch die Summe der quadrierten Werte der entsprechenden Beladungen Spalte in gegebenen . (D) Geometrisch überspannen Ladungen immer noch den gleichen k- dimensionalen Unterraum in R p (den von den ersten k PCA-Eigenvektoren aufgespannten Unterraum ). (E) Die Annäherung an X und der Rekonstruktionsfehler änderten sich überhaupt nicht. (F) Die Kovarianzmatrix approximiert wird noch ebenso gut: & Sigma; LLrOtkRpkX

ΣLkLk=LrOtLrOt.

Aber die Sichtweise im PCA-Stil ist praktisch zusammengebrochen. Gedrehte Lasten entsprechen nicht mehr den orthogonalen Richtungen / Achsen in , dh Spalten von sind nicht orthogonal! Schlimmer noch, wenn Sie die Daten [orthogonal] auf die Richtungen projizieren, die durch die gedrehten Ladungen vorgegeben sind, erhalten Sie korrelierte (!) Projektionen und können die Ergebnisse nicht wiederherstellen. [Um die standardisierten Ergebnisse nach der Rotation zu berechnen, muss die Datenmatrix mit dem Pseudo-Inversen der Ladungen multipliziert werden. . Alternativ kann man einfach die ursprünglichen standardisierten Punktzahlen mit der Rotationsmatrix drehen:L R o t ~ U r o t = X ( L + R o t ) ~ U r o t = ~ U T kkRpLrOtU~rOt=X(LrOt+)U~rOt=U~T ] Außerdem erfassen die gedrehten Komponenten nicht nacheinander den maximalen Betrag der Varianz: Die Varianz wird zwischen den Komponenten (gerade) neu verteilt obwohl alle gedrehten Komponenten genau so viel Varianz erfassen wie alle ursprünglichen Hauptkomponenten).kk

Hier ist eine Illustration. Die Daten sind eine 2D-Ellipse, die sich entlang der Hauptdiagonale erstreckt. Die erste Hauptrichtung ist die Hauptdiagonale, die zweite ist orthogonal dazu. PCA-Ladevektoren (mit den Eigenwerten skalierte Eigenvektoren) werden in roter Farbe angezeigt, wobei sie in beide Richtungen weisen und für die Sichtbarkeit auch um einen konstanten Faktor gedehnt sind. Dann habe ich den Ladungen eine orthogonale Drehung um . Die resultierenden Ladevektoren werden in Magenta angezeigt. Beachten Sie, dass sie nicht orthogonal sind (!).30

PCA-Drehung

Eine FA-artige Intuition ist hier wie folgt: Stellen Sie sich einen "latenten Raum" vor, in dem Punkte einen kleinen Kreis füllen (stammen aus einem 2D-Gaußschen mit Einheitsvarianzen). Diese Punkteverteilung wird dann entlang der PCA-Ladungen (rot) gestreckt , um die Datenellipse zu erhalten, die wir in dieser Abbildung sehen. Die gleiche Verteilung von Punkten kann jedoch gedreht und dann entlang der gedrehten PCA-Ladungen (Magenta) gestreckt werden, um die gleiche Datenellipse zu erhalten .

[Um zu sehen, dass eine orthogonale Rotation von Ladungen eine Rotation ist , muss ein PCA-Biplot betrachtet werden. dort drehen sich die Vektoren / Strahlen, die den ursprünglichen Variablen entsprechen, einfach.]


Fassen wir zusammen. Nach einer orthogonalen Drehung (z. B. Varimax) sind die Hauptachsen nicht orthogonal, und orthogonale Projektionen darauf sind nicht sinnvoll. Man sollte also eher diesen ganzen Achsen- / Projektionsgesichtspunkt fallen lassen. Es wäre seltsam, es immer noch PCA zu nennen (das sind Projektionen mit maximaler Varianz usw.).

Aus Sicht des FA-Stils haben wir einfach unsere (standardisierten und unkorrelierten) latenten Faktoren gedreht, was eine gültige Operation ist. Es gibt keine "Projektionen" in FA; Stattdessen erzeugen latente Faktoren die beobachteten Variablen über Ladungen. Diese Logik bleibt erhalten. Wir haben jedoch mit Hauptkomponenten begonnen, die eigentlich keine Faktoren sind (da PCA nicht mit FA identisch ist). Es wäre also seltsam, es auch FA zu nennen.

Anstatt zu diskutieren, ob man es lieber als PCA oder FA bezeichnen sollte, würde ich empfehlen, das genau verwendete Verfahren akribisch zu spezifizieren: "PCA gefolgt von einer Varimax-Rotation".


TTUSV

Amöbe sagt Reinstate Monica
quelle
Ich habe den Text, der das Bild umgibt, nicht vollständig verstanden. Sie verwenden "Ladungen" mehrmals: PCA loading vectors... are shown in red, stretched along the rotated PCA loadings (magenta). Ich frage mich, wie "Ladungen" oder deren "Vektor" als Achsen im Datenstreudiagramm dargestellt werden könnten. Können Sie das bitte klarer machen? Und die Idee des "Dehnens"? Vielen Dank.
TTNPHNS
1
Dies könnte mit der langen Diskussion zusammenhängen, die wir kürzlich über Ladevorgänge hatten, die sich über einen Unterraum im variablen Raum erstrecken oder nicht. In dieser Antwort habe ich "Ladevektor" (oder einfach "Ladungen") verwendet, um auf eine Spalte der Ladungsmatrix zu verweisen. In meinem Beispiel sind die Daten 2D, dh es gibt zwei Variablen, und daher sind Ladungen 2D-Vektoren. Daher kann ich sie auf dem Datenstreudiagramm darstellen (ich habe sie mit einem konstanten Faktor für die Sichtbarkeit skaliert). In PCA sind die Belastungen natürlich orthogonal (sie sind proportional zu den Eigenvektoren). Nach Varimax sind sie nicht mehr.
Amöbe sagt Reinstate Monica
Den Absatz über "Strecken" (direkt nach dem Bild) sollte ich wohl besser illustrieren; Ich kann sehen, dass es nicht sehr klar ist.
Amöbe sagt Reinstate Monica
Ich dachte, wenn Sie die Orthogonalität oder Nichtorthogonalität einiger Vektoren (wie z. B. Ladungen) darstellen möchten, sollten Sie sie als Pfeile zeichnen. Oder verstehe ich dich vielleicht nicht?
TTNPHNS
1
Ich stimme zu, dass die Verwendung von Pfeilen besser wäre. Ich habe die "Pfeilspitzen" nur aus Gründen der Übersichtlichkeit weggelassen. Ich könnte diese Zahl wiederholen, um sie hinzuzufügen. Außerdem habe ich jeden Vektor in beide Richtungen gezeichnet, da die Vorzeichen keine Rolle spielen.
Amöbe sagt Reinstate Monica
29

Die Hauptkomponentenanalyse (PCA) und die Common Factor Analysis (CFA) sind unterschiedliche Methoden. Häufig führen sie zu ähnlichen Ergebnissen, und PCA wird als Standardextraktionsmethode in den SPSS-Faktoranalyse-Routinen verwendet. Dies führt zweifellos zu einer Menge Verwirrung über die Unterscheidung zwischen den beiden.

Unterm Strich sind dies konzeptionell zwei verschiedene Modelle. In PCA sind die Komponenten tatsächliche orthogonale Linearkombinationen, die die Gesamtvarianz maximieren. In FA sind die Faktoren Linearkombinationen, die den gemeinsamen Teil der Varianz maximieren - zugrunde liegende "latente Konstrukte". Deshalb wird FA oft als "Common Factor Analysis" bezeichnet. FA verwendet eine Vielzahl von Optimierungsroutinen und das Ergebnis hängt im Gegensatz zu PCA von der verwendeten Optimierungsroutine und den Startpunkten für diese Routinen ab. Es gibt einfach keine einzige Lösung.

In R bietet die factanal () -Funktion CFA eine maximale Wahrscheinlichkeitsextraktion. Sie sollten also nicht erwarten, dass es ein SPSS-Ergebnis reproduziert, das auf einer PCA-Extraktion basiert. Es ist einfach nicht dasselbe Modell oder dieselbe Logik. Ich bin mir nicht sicher, ob Sie dasselbe Ergebnis erzielen würden, wenn Sie die SPSS-Maximum-Likelihood-Extraktion verwenden, da diese möglicherweise nicht denselben Algorithmus verwenden.

In R können Sie jedoch die vertauschte "Faktoranalyse" reproduzieren, die SPSS standardmäßig bereitstellt. Hier ist der Prozess in R. Mit diesem Code kann ich das Ergebnis der SPSS-Hauptkomponente "Faktoranalyse" mithilfe dieses Datensatzes reproduzieren. (Mit Ausnahme des Zeichens, das nicht bestimmbar ist). Dieses Ergebnis könnte dann auch mit einer der verfügbaren Rotationsmethoden gedreht werden.

# Load the base dataset attitude to work with.
data(attitude)
# Compute eigenvalues and eigen vectors of the correlation matrix.
pfa.eigen<-eigen(cor(attitude))
# Print and note that eigen values are those produced by SPSS.
# Also note that SPSS will extract 2 components as eigen values > 1 = 2
pfa.eigen$values
# set a value for the number of factors (for clarity)
factors<-2
# Extract and transform two components.
pfa.eigen$vectors [ , 1:factors ]  %*% 
+ diag ( sqrt (pfa.eigen$values [ 1:factors ] ),factors,factors )
Brett
quelle
+1, um die Verwirrung um SPSS vs R hier wirklich zu dämpfen. Zwei Fragen bleiben offen: Was bedeutet R prcompoder im princompVergleich zum gemischten Ansatz von SPSS? Was macht SPSS eigentlich beim Extrahieren?
hans0l0
ah, und darf ich Ihrer Lösung hinzufügen, wie Sie die Punktzahlen für zB PC1 berechnen: standardisieren zz <- scale(attitude,T,T)und pc1 <- zz %*% solve(cor(attitude),lamba[,1]). Wobei Lambda das Ergebnis der letzten Zeile von @Brett Magills Beispiel ist.
hans0l0
3
-1. Obwohl diese Antwort viele nützliche Informationen enthält, finde ich, dass sie die ursprüngliche Frage überhaupt nicht beantwortet. Die ursprüngliche Frage war, ob PCA + -Rotation immer noch als PCA (oder besser FA) betrachtet werden kann. Ihre Antwort erwähnt nicht einmal Rotationen! Wie kann es also eine Antwort sein?
Amöbe sagt Reinstate Monica
1
Es kann hilfreich sein, darauf hinzuweisen, dass die Common Factor Analysis nicht mit der Confirmatory Factor Analysis (auch CFA) identisch ist, bei der es sich um ein völlig anderes Verfahren handelt.
Richard Border
11

Diese Antwort soll in Form eines Pfaddiagramms zeigen, worüber @amoeba in seiner tiefen (aber etwas komplizierten) Antwort auf diesen Thread argumentiert hat (ich bin damit zu 95% einverstanden) und wie sie mir erscheinen .

P

In der Grafik nehme ich ein einfaches Beispiel für zwei Variablen p=2und verwende beide extrahierten Hauptkomponenten. Obwohl wir normalerweise nur wenige erste m<pKomponenten behalten , spielt es für die theoretische Frage, die wir uns stellen ("Ist PCA mit Rotation eine PCA oder was?"), Keine Rolle, ob moder alle pbeibehalten werden sollen. Zumindest in meiner speziellen Antwort.

LVPzAX=PV=PzA. Aber Ladungen eröffnen Perspektiven: (i) die Komponenten zu interpretieren; (ii) gedreht werden; (iii) Korrelationen / Kovarianzen der Variablen wiederherzustellen. Dies ist alles auf die Tatsache zurückzuführen, dass die Variabilität der Daten in Ladungen als deren Belastung geschrieben wurde.

PzPzQUm die Interpretation der Ladungen zu erleichtern, warten die Datenpunkte passiv auf ihre keusche Sphärizität und Identität (oder "Weißheit").

QPzArCzX=PzA=CzArArC

C

EINVEINr

PQ."C"Q.Q.PQ. VQ.Vr"C"=XVr

Diese zuletzt skizzierten Aktionen (die größtenteils sinnlos sind) erinnern uns daran, dass Eigenvektoren, nicht nur Ladungen, im Allgemeinen gedreht werden könnten. Zum Beispiel könnte das Varimax-Verfahren auf sie angewendet werden , um ihre Struktur zu vereinfachen . Da Eigenvektoren jedoch bei der Interpretation der Bedeutung der Komponenten nicht so hilfreich sind wie die Ladungen, wird die Drehung der Eigenvektoren selten durchgeführt.

Bildbeschreibung hier eingeben

Also, PCA mit anschließender Varimax (oder anderer) Rotation ist

  • immer noch PCA
  • die auf dem Weg Hauptkomponenten für nur Komponenten aufgegeben
  • das sind möglicherweise mehr (als die PCs) als "latente Merkmale" interpretierbar
  • wurden aber nicht satistisch modelliert wie diese (PCA ist keine faire Faktorenanalyse)

Ich habe in dieser Antwort nicht auf die Faktorenanalyse Bezug genommen. Es scheint mir, dass @ amoebas Verwendung des Wortes "latenter Raum" im Kontext der gestellten Frage ein bisschen riskant ist. Ich werde, schließe jedoch, dass PCA + analytische Rotation „FA- nennen könnte Stil Blick auf PCA“.

ttnphns
quelle
Wie werden die Eigenwerte der gedrehten Komponenten berechnet?
1
@Haga, gedrehter Komponenten sind nicht Hauptkomponenten mehr und so können sie Eigenwerte nicht haben. Ihre Varianzen entsprechen jedoch den Spaltensummen der Quadratladungen (siehe unten in meiner Tabelle - Pfeil für nicht standardisierte Bewertungen).
TTNPHNS
8

In psych::principal()Sie verschiedene Arten von Drehungen / Transformationen extrahieren Principal Component tun können (n) oder '' PC '' die Verwendung von rotate=Argumente, wie: "none", "varimax"(Default), "quatimax", "promax", "oblimin", "simplimax", und "cluster". Sie müssen empirisch entscheiden, welches in Ihrem Fall sinnvoll sein sollte, falls dies erforderlich ist, abhängig von Ihrer eigenen Einschätzung und Kenntnis des zu untersuchenden Gegenstands. Eine Schlüsselfrage, die Ihnen einen Hinweis geben könnte: Welche ist interpretierbarer (bei Bedarf erneut)?

In der Hilfe finden Sie möglicherweise auch Folgendes hilfreich:

Es ist wichtig zu erkennen, dass gedrehte Hauptkomponenten keine Hauptkomponenten sind (die mit der Eigenwertzerlegung verbundenen Achsen), sondern lediglich Komponenten. Um dies zu verdeutlichen, werden nicht gedrehte Hauptkomponenten als PCi bezeichnet, während gedrehte PCs jetzt als RCi (für gedrehte Komponenten) und schräg transformierte Komponenten als TCi (für transformierte Komponenten) bezeichnet werden. (Danke an Ulrike Gromping für diesen Vorschlag.)

Promotion
quelle
7

Ich verstehe, dass die Unterscheidung zwischen PCA- und Faktoranalyse in erster Linie darin besteht, ob ein Fehlerbegriff vorliegt. Auf diese Weise kann und wird PCA die Daten getreu wiedergeben, wohingegen die Faktorenanalyse den Daten, auf denen sie trainiert wurde, weniger treu ist, sondern versucht, zugrunde liegende Trends oder Gemeinsamkeiten in den Daten darzustellen. Bei einem Standardansatz wird PCA nicht gedreht, aber es ist mathematisch möglich, so dass die Leute es von Zeit zu Zeit tun. Ich stimme den Kommentatoren darin zu, dass die "Bedeutung" dieser Methoden etwas zu gewinnen ist und dass es wahrscheinlich sinnvoll ist, sicher zu sein, dass die von Ihnen verwendete Funktion das tut, was Sie beabsichtigen - zum Beispiel, wenn Sie feststellen, dass R einige Funktionen hat, die funktionieren Eine andere Art von PCA als Benutzer von SPSS.

russellpierce
quelle
2

Dank des Chaos in den Definitionen von beiden sind sie praktisch ein Synonym. Glauben Sie keinen Worten und schauen Sie tief in die Docks, um die Gleichungen zu finden.


quelle
3
Ich kämpfe immer noch darum, Gleichungen zu verstehen (Biologe ahoi). Deshalb habe ich mich hier an die Community gewandt, in der Hoffnung, dass es mir hilft, den Unterschied in den Begriffen des Laien zu erklären.
Roman Luštrik
Ich denke, die Ideologie ist, dass FA davon ausgeht, dass der Prozess von einigen 'versteckten Faktoren' getrieben wird, während die Daten, die wir haben, aus einigen Kombinationen von ihnen bestehen. Aus diesem Grund besteht das Problem von FA darin, die versteckten Faktoren irgendwie zu rekonstruieren. Und da ist PCA - eine Methode, mit der iterativ neue Variablen (PCs) erstellt werden, indem die alten gemischt werden, um die Varianz der Daten gierig zu absorbieren. Man kann sagen, die PCs entsprechen den Faktoren des FA, und hier werden sie nicht zu unterscheiden sein. Man kann aber auch einige Änderungen an der PCA vornehmen, um sie zu einer Basis einer anderen 'FA-Art' zu machen, und so beginnt das Problem.
Grundsätzlich sollten Sie sich überlegen, was Sie tun möchten (nicht welches Schlagwort Sie verwenden möchten). Ich weiß, dass es schwierig ist, vor allem, wenn Biologen in der Nähe sind (in gewissem Maße funktioniert Use-Buzzword gut in der Biologie, sie gehen also nur davon aus, dass dies in anderen Disziplinen üblich ist). Dennoch ist dies die Art und Weise, wie die Wissenschaft getan werden sollte. Dann benutze Google (oder diese Seite), um den guten Algorithmus dafür zu bewerten. Verwenden Sie schließlich die Docks, um eine Funktion / Schaltfläche zu finden, die dies ausführt, und geben Sie sie ein / klicken Sie darauf.
1

Obwohl diese Frage bereits eine akzeptierte Antwort hat, möchte ich dem Punkt der Frage etwas hinzufügen.

"PCA" - wenn ich mich richtig erinnere - bedeutet "Hauptkomponentenanalyse"; Solange Sie die Hauptkomponenten analysieren, sei es ohne Drehung oder mit Drehung, befinden wir uns immer noch in der Analyse der "Hauptkomponenten" (die durch die entsprechende anfängliche Matrixzerlegung gefunden wurden).

Ich würde formulieren, dass wir nach der "Varimax" -Rotation der ersten beiden Hauptkomponenten die "Varimax-Lösung der beiden ersten PCs" (oder etwas anderes) haben, aber immer noch im Rahmen der Analyse der Hauptkomponenten sind. oder kürzer, sind im Rahmen von "pca".

Um meinen Standpunkt noch klarer zu machen: Ich glaube nicht, dass die einfache Frage der Rotation das Problem der Unterscheidung zwischen EFA und CFA aufwirft (letzteres wurde zum Beispiel in der Antwort von Brett erwähnt / in das Problem eingeführt).

Gottfried Helms
quelle
Warum haben Sie CFA im letzten Satz plötzlich erwähnt?
Amöbe sagt Reinstate Monica
@amoeba: Ich wurde durch die mit 23 Punkten ausgezeichnete Antwort von _Brett auf diesen Begriff hingewiesen und fand, dass es sich lohnt, etwas darüber zu bemerken. Aber vielleicht wäre es besser gewesen, stattdessen "FA" zu sagen. Ich werde darüber nachdenken ... (Wenn ich darüber nachdenke, erinnere ich mich vage, dass "CFA" in meinen früheren Studien dieser Methode, möglicherweise in den 80er Jahren, als "Bestätigungsfaktoranalyse" statt als "häufig ..." angesehen wurde oder 90'ies)
Gottfried Helms
Es ist nur so, dass sich die ersten drei Absätze Ihrer Antwort auf PCA vs. FA beziehen und der letzte Absatz, der so aussieht, als würde er die vorherigen zusammenfassen, sich plötzlich auf EFA vs. CFA bezieht.
Amöbe sagt Reinstate Monica
@amoeba: Macht meine letzte Änderung meine Absicht / meinen Satz klarer?
Gottfried Helms
1

Ich fand dies die hilfreich sein: Abdi & Williams, 2010, Hauptkomponentenanalyse .

DREHUNG

Nachdem die Anzahl der Komponenten bestimmt wurde und um die Interpretation zu erleichtern, beinhaltet die Analyse häufig eine Rotation der Komponenten, die beibehalten wurden [siehe z. B. Lit. 40 und 67 für weitere Einzelheiten]. Es werden zwei Haupttypen der Rotation verwendet: orthogonal, wenn die neuen Achsen ebenfalls orthogonal zueinander sind, und schräg, wenn die neuen Achsen nicht orthogonal sein müssen. Da die Rotationen immer in einem Unterraum ausgeführt werden, erklären die neuen Achsen immer weniger Trägheit als die ursprünglichen Komponenten (die als optimal berechnet werden). Der Teil der Trägheit, der durch den gesamten Unterraum nach der Drehung erklärt wird, ist jedoch derselbe wie vor der Drehung (nur die Aufteilung der Trägheit hat sich geändert). Es ist auch wichtig zu beachten, dass die Rotation immer in einem Unterraum stattfindet (dh Die Wahl dieses Unterraums hat großen Einfluss auf das Ergebnis der Rotation. Es wird daher dringend empfohlen, mehrere Größen für den Unterraum der zurückgehaltenen Komponenten zu verwenden, um die Robustheit der Interpretation der Rotation zu beurteilen. Bei der Durchführung einer Rotation beziehen sich die Begriffe Ladungen fast immer auf die Elemente der Matrix Q.

(Definition von Q siehe Papier).

Dylan_Larkin
quelle