Linearität von PCA

35

PCA wird jedoch als lineares Verfahren angesehen:

PCA(X)PCA(X1)+PCA(X2)++PCA(Xn),

Dabei ist . Dies bedeutet, dass die von den PCAs auf den Datenmatrizen erhaltenen Eigenvektoren sich nicht zu den von der PCA auf der Summe der Datenmatrizen erhaltenen Eigenvektoren summieren . Aber ist die Definition einer linearen Funktion :X i X i fX=X1+X2++XnXiXif

f(x+y)=f(x)+f(y)?

Warum wird PCA als "linear" betrachtet, wenn es diese grundlegende Bedingung der Linearität nicht erfüllt?

Alpha Omega
quelle
Ich habe einmal geschrieben oder gehört (sorry, ich kann mich nicht erinnern, wo oder wann), dass PCA "zur Familie der linearen Prozeduren gehört", weil es auf linearen Abhängigkeiten zwischen Variablen beruht. Es verwendet die Pearson-Korrelationsmatrix und sucht nach linearen Kombinationen höchster Varianz.
Łukasz Deryło
4
Das Wesen dieser Frage könnte durch die Betrachtung der viel einfacheren und routinemäßigeren Einstellung einer gewöhnlichen Regression kleinster Quadrate deutlicher werden: Dies ist der Archetyp eines linearen statistischen Verfahrens. Nichtsdestoweniger ist das Verfahren der kleinsten Quadrate Koeffizienten Abschätzen einer offensichtlich nicht - lineare Funktion der Datenmatrix , wie durch die Formel attestiert β = ( X ' X ) - 1 X ' y . (Beachten Sie, dass es eine lineare Funktion des Antwortvektors y ist .)Xβ^=(XX)1Xyy
whuber
4
Es könnte sich lohnen, sich daran zu erinnern, dass f (x) = x + 1 auch eine "lineare Funktion" ist ... aber es erfüllt nicht das, was Sie gerade gesagt haben ... was etwas erklären sollte.
Mehrdad
Das liegt daran, dass (X1+X2)T(X1+X2)X1TX1+X2TX2
Gabriel Romon

Antworten:

39

Wenn wir sagen, dass PCA eine lineare Methode ist, beziehen wir uns auf die dimensionalitätsreduzierende Abbildung vom hochdimensionalen Raum R p auf einen niederdimensionalen Raum R k . In PCA ist diese Abbildung durch Multiplikation von x mit der Matrix von PCA-Eigenvektoren gegeben und ist daher offensichtlich linear (Matrixmultiplikation ist linear): z = f ( x ) = V V x . Dies steht im Gegensatz zu nichtlinearen Verfahren zur Dimensionsreduzierung , bei denen die dimensionalitätsreduzierende Abbildung nichtlinear sein kann.f:xzRpRkx

z=f(x)=Vx.

Andererseits werden die oberen Eigenvektoren V ectors R p × k aus der Datenmatrix XR n × p unter Verwendung dessen berechnet , was Sie in Ihrer Frage P C A ( ) genannt haben : V = P C A ( X ) , und Diese Abbildung ist sicherlich nichtlinear: Es werden Eigenvektoren der Kovarianzmatrix berechnet, was ein nichtlineares Verfahren ist. (Als einfaches Beispiel multiplizieren Sie X mit 2kVRp×kXRn×pPCA()

V=PCA(X),
X2erhöht die Kovarianzmatrix um , aber ihre Eigenvektoren bleiben gleich wie sie normalisiert sind, um eine Einheitslänge zu haben.)4
Amöbe sagt Reinstate Monica
quelle
Dass ich 35 Upvotes für diese triviale Antwort bekommen habe, ist ziemlich lächerlich (und liegt hauptsächlich daran, dass dieser Thread eine Weile in den Hot Network Questions war).
Amöbe sagt Reinstate Monica
5

"Linear" kann viele Dinge bedeuten und wird nicht ausschließlich formal verwendet.

PCA wird häufig nicht als eine Funktion im formalen Sinne definiert, und es wird daher nicht erwartet, dass es die Anforderungen einer linearen Funktion erfüllt, wenn es als solche beschrieben wird. Es wird, wie Sie sagten, öfter als Prozedur und manchmal als Algorithmus beschrieben (obwohl mir diese letzte Option nicht gefällt). Es wird oft gesagt, dass es auf informelle, nicht genau definierte Weise linear ist.

Xi

XifY(α)
αRkYkY

fi

fY(α)=i=1kαiYi
Y

Yαij

broncoAbierto
quelle
3

PCA liefert / ist eine lineare Transformation.

MPCA(X1+X2)M(X1+X2)=M(X1)+M(X2)

PCA(X1+X2)PCA(X1)PCA(X2)


Zum Vergleich ein sehr einfaches Beispiel eines Prozesses, der eine lineare Transformation verwendet, aber selbst keine lineare Transformation ist:

D(v)v[x,y]=[1,0]

D([1,1])[0,2]

und

D([0,1])[1,0]

aber

D([1,1]+[0,1]=[1,2])[0.78,2.09][1,2]

Diese Verdopplung des Winkels, die die Berechnung von Winkeln beinhaltet, ist nicht linear und entspricht der Aussage von Amöben, dass die Berechnung des Eigenvektors nicht linear ist

Sextus Empiricus
quelle