Angenommen, ist der Vektor, der die Varianz der Projektion der Daten mit der Entwurfsmatrix maximiert .X
Nun habe ich Materialien gesehen, die als (ersten) Hauptbestandteil der Daten bezeichnen, der auch der Eigenvektor mit dem größten Eigenwert ist.
Ich habe jedoch auch gesehen, dass die Hauptkomponente der Daten .
Offensichtlich sind und verschiedene Dinge. Kann mir hier jemand helfen und mir sagen, was der Unterschied zwischen diesen beiden Definitionen der Hauptkomponenten ist?X u
pca
terminology
definition
mein Name ist Jeff
quelle
quelle
Antworten:
Sie haben absolut Recht, wenn Sie feststellen, dass (einer der Eigenvektoren der Kovarianzmatrix, z. B. der erste) und X u (Projektion der Daten auf den von u aufgespannten eindimensionalen Unterraum ) zwei verschiedene Dinge sind Sie werden oft als "Hauptbestandteil" bezeichnet, manchmal sogar im selben Text.u X u u
In den meisten Fällen ergibt sich aus dem Zusammenhang, was genau gemeint ist. In einigen seltenen Fällen kann es jedoch durchaus verwirrend sein, z. B. wenn verwandte Techniken (wie spärliche PCA oder CCA) erörtert werden, bei denen verschiedene Richtungen nicht orthogonal sein müssen. In diesem Fall hat eine Aussage wie "Komponenten sind orthogonal" sehr unterschiedliche Bedeutungen, je nachdem, ob es sich um Achsen oder Projektionen handelt.uich
Ich würde befürworten Aufruf a „Hauptachse“ oder eine „Hauptrichtung“, und X u a „Hauptbestandteil“.u X u
Ich habe als "Hauptkomponentenvektor" bezeichnet gesehen.u
Ich sollte erwähnen, dass die alternative Konvention darin besteht, "Hauptkomponente" und X u "Hauptkomponentenbewertungen" zu nennen.u X u
Zusammenfassung der beiden Konventionen:
Hinweis: Nur Eigenvektoren der Kovarianzmatrix, die Nicht-Null-Eigenwerten entsprechen, können als Hauptrichtungen / -komponenten bezeichnet werden. Wenn die Kovarianzmatrix einen niedrigen Rang hat, hat sie einen oder mehrere Null-Eigenwerte. entsprechende Eigenvektoren (und entsprechende Projektionen, die konstant Null sind) sollten nicht als Hauptrichtungen / -komponenten bezeichnet werden. Siehe eine Diskussion in meiner Antwort hier.
quelle