Ich weiß, wie man PCA und SVD mathematisch berechnet, und ich weiß, dass beide auf die lineare Regression der kleinsten Quadrate angewendet werden können.
Der Hauptvorteil von SVD scheint mathematisch zu sein, dass es auf nicht quadratische Matrizen angewendet werden kann.
Beide konzentrieren sich auf die Zerlegung der Matrix. Gibt es außer den genannten Vorteilen von SVD zusätzliche Vorteile oder Erkenntnisse, die durch die Verwendung von SVD gegenüber PCA erzielt werden?
Ich suche wirklich eher nach der Intuition als nach irgendwelchen mathematischen Unterschieden.
pca
least-squares
svd
Baz
quelle
quelle
advantage... SVD over PCA
- svd und PCA nicht als mathematische Operation und Datenanalysemethode verglichen werden. Kann Ihre Frage etwas über Möglichkeiten sein, PCA zu machen ? Oder was fragst du?Antworten:
SVD hat also keinen "Vorteil" gegenüber PCA, weil man sich die Frage stellt, ob Newtons Methode besser ist als die der kleinsten Fehlerquadrate: Die beiden sind nicht vergleichbar.
quelle
Die Frage ist wirklich, ob Sie eine Z-Score-Normalisierung der Spalten durchführen sollten, bevor Sie die SVD anwenden. Dies liegt daran, dass PCA die obige Transformation ist, der die SVD folgt. Manchmal ist die Normalisierung ziemlich schädlich. Wenn Ihre Daten zum Beispiel (transformierte) Wortzählungen sind, die positiv sind, ist das Subtrahieren des Mittelwerts definitiv schädlich. Dies liegt daran, dass Nullen, die das Fehlen eines Wortes in einem Dokument darstellen, negativen Zahlen mit hoher Größe zugeordnet werden. Bei linearen Problemen sollte die höhere Größe verwendet werden, um den Bereich darzustellen, in dem Ihre Features am empfindlichsten sind. Auch das Teilen durch die Standardabweichung ist für diese Art von Daten schädlich.
quelle