Normalisieren aller Variablen im Vergleich zur Verwendung der Option scale = TRUE in prcomp in R.

7

Was ist der Unterschied zwischen

  1. Normalisieren der Variablen und Durchführen von PCA;
  2. Verwenden der scale=TRUEOption (ohne Normalisierung der Variablen) in der prcompFunktion in R?
Nandha Kumar M.
quelle
Ich habe Ihren letzten Satz / Absatz gelöscht, weil er sehr schwer zu verstehen war, während Ihre Frage bereits ohne ihn sehr klar ist.
Amöbe

Antworten:

9

Kein Unterschied. Geben Sie debug(prcomp)vor dem Ausführen ein prcomp. Die dritte Zeile der Funktion lautet : x <- scale(x, center = center, scale = scale.); dh. Sie skalieren entweder innerhalb der Funktion, wenn Sie diese scale = TRUEwährend des Funktionsaufrufs festlegen , oder Sie lassen die Skalierung ursprünglich von Ihnen durchführen.

Wenn Sie PCA im Allgemeinen anwenden, ist es jedoch eine gute Idee, Ihre Variablen zu skalieren. Andernfalls dominiert die Größe bestimmter Variablen die Assoziationen zwischen den Variablen in der Stichprobe. Sofern nicht alle Ihre Variablen in derselben Skala aufgezeichnet sind und / oder der Unterschied in den Variablengrößen von Interesse ist, würde ich vorschlagen, dass Sie Ihre Daten vor der PCA normalisieren. Dieses Problem wurde im Lebenslauf mehrmals wiederholt, z. 1 , 2 , 3 .

usεr11852
quelle
Was ist, wenn alle Ihre Variablen auf derselben Skala liegen?
Jack Armstrong
In diesem Fall benötigen wir wahrscheinlich keine Normalisierung, da die Variablen in ihren ursprünglichen Maßstäben vergleichbar sind. Bitte lesen Sie die verlinkten Threads für weitere Details.
usεr11852