Warum sind die Bewertungen der Hauptkomponenten nicht korreliert?

9

Angenommen, ist eine Matrix von mittelzentrierten Daten. Die Matrix ist , hat verschiedene Eigenwerte und Eigenvektoren , ... , die orthogonal sind.AS=cov(A)m×mms1s2sm

Die te Hauptkomponente (manche Leute nennen sie "Scores") ist der Vektor . Mit anderen Worten, es ist eine lineare Kombination der Spalten von , wobei die Koeffizienten die Komponenten des ten Eigenvektors von .izi=AsiAiS

Ich verstehe nicht, warum und für alle unkorreliert sind . Folgt daraus, dass und orthogonal sind? Sicher nicht, denn ich kann leicht eine Matrix und ein Paar orthogonaler Vektoren so dass und korreliert sind.zizjijsisjBx,yBxBy

Ernest A.
quelle
Eine verwandte Antwort stats.stackexchange.com/a/110546/3277 .
ttnphns

Antworten:

7

zizj=(Asi)(Asj)=siAAsj=(n1)siSsj=(n1)siλjsj=(n1)λjsisj=0.
Amöbe
quelle
1
Mathematik: Was für eine schöne Sprache.
Néstor
4
Dies bedeutet, dass und orthogonal sind. Nicht korreliert bedeutet, dass dies wahr sein muss: . Ich nehme an, dass und dann auch impliziert, dass sie nicht sind. zizj(ziz¯i)(zjz¯j)=0z¯i=z¯j=0zizj=0
Ernest A
2
Guter Punkt, @Ernest. Die Mittelwerte sind in der Tat Null, da die Daten (gemäß Ihrer Annahme) auf den Mittelwert zentriert wurden. Dann müssen alle Projektionen den Mittelwert Null haben.
Amöbe
2
@Jubbles weil , also . S=cov(A)=1n1AAAA=(n1)S
Ernest A
2
@Ernest, ich konnte nicht widerstehen, eine Antwort ohne Text zu liefern, aber vielleicht sollte ich hinzufügen, dass der zugrunde liegende Grund, warum PCs nicht korreliert sind, darin besteht, dass ihre Kovarianzmatrix durch in der Eigenvektorbasis gegeben ist und in dieser Basis diagonal wird - - das ist der springende Punkt der Eigenzersetzung. SS
Amöbe