Welche Norm des Rekonstruktionsfehlers wird durch die mit PCA erhaltene niedrigrangige Approximationsmatrix minimiert?

Antworten:

30

Einzelwortantwort: Beide.


X2

X2=supXv2v2=meinx(sich)
siXSX=USV
XF=ichjXichj2=tr(XX)=sich2,
sichXSX=USV

PCA wird durch dieselbe Singularwertzerlegung gegeben, wenn die Daten zentriert sind. sind Hauptkomponenten, sind Hauptachsen, dh Eigenvektoren der Kovarianzmatrix, und die Rekonstruktion von mit nur den Hauptkomponenten, die den größten Singularwerten entsprechen, ist gegeben durch .V X k k X k = U k S k V kUSVXkkXk=UkSkVk

Das Eckart-Young-Theorem besagt, dass die Matrix ist, die die Norm des Rekonstruktionsfehlers minimiert unter allen Matrizen vom Rang . Dies gilt sowohl für die Frobenius-Norm als auch für den Operator -norm. Wie @cardinal in den Kommentaren ausführte, wurde es erstmals 1907 von Schmidt (von Gram-Schmidt berühmt) für den Fall Frobenius bewiesen. Es wurde später von Eckart und Young im Jahr 1936 wiederentdeckt und ist heute meist mit ihren Namen verbunden. Mirsky verallgemeinerte den Satz 1958 auf alle Normen, die bei einheitlichen Transformationen unveränderlich sind, und dies schließt die Operator-2-Norm ein.X - A A k 2XkX-EINEINk2

Dieser Satz wird manchmal Eckart-Young-Mirsky-Satz genannt. Stewart (1993) nennt es Schmidt-Näherungssatz. Ich habe sogar das Schmidt-Eckart-Young-Mirsky-Theorem gesehen.


Nachweis für den Betreiber -norm2

Sei von vollem Rang . Da Rang , hat sein Nullraum Dimensionen. Der Raum, der von den rechten Singularvektoren von entsprechend den größten Singularwerten überspannt wird , hat Dimensionen. Diese beiden Räume müssen sich also kreuzen. Sei ein Einheitsvektor von der Schnittmenge. Dann erhalten wir: QED.n A k n - k k + 1 x k + 1XnEINkn-kk+1Xk+1X - A 2 2( X - A ) w 2 2 = X w 2w

X-EIN22(X-EIN)w22=Xw22=ich=1k+1sich2(vichw)2sk+12=X-Xk22,

Beweis für die Frobenius-Norm

Wir wollen die Matrix vom Rang , die . Wir können Faktorisierung , wo hat orthonormal Spalten. Das Minimieren von für festes ist ein Regressionsproblem mit Lösung . Wenn wir es , sehen wir, dass wir jetzt minimieren müssen. wobei die Kovarianzmatrix von , dhk X - A 2 F A = B W W k X - B W 2 WEINkX-EINF2EIN=BWWkX-BW2WX - X W W 2 = X 2 - X W W 2 = c o n s t - t r (B=XWΣ X Σ = X X / ( n - 1 ) W k

X-XWW2=X2-XWW2=cOnst-tr(WWXXWW)=cOnst-cOnsttr(WΣW),
ΣXΣ=XX/(n-1). Dies bedeutet, dass der Rekonstruktionsfehler minimiert wird, indem als Spalten von einige Orthonormalvektoren genommen werden, die die Gesamtvarianz der Projektion maximieren.Wk

Es ist bekannt, dass dies die ersten Eigenvektoren der Kovarianzmatrix sind. In der Tat, wenn , dann ist . Wenn wir schreiben, das auch orthonormale Spalten hat, erhalten wir wobei das Maximum erreicht wird, wenn . Der Satz folgt dann sofort.X = U S V & Sigma; = V S 2 V / ( n - 1 ) = V Λ V R = V W t r ( W kX=USVΣ=VS2V/(n-1)=VΛVR=VW

tr(WΣW)=tr(RΛR)=ichλichjRichj2ich=1kλk,
W=Vk

Siehe die folgenden drei verwandten Themen:


Früherer Versuch eines Beweises für die Frobenius-Norm

Diesen Beweis habe ich irgendwo online gefunden, aber er ist falsch (enthält eine Lücke), wie von @cardinal in den Kommentaren erklärt.

Die Frobenius-Norm ist bei einheitlichen Transformationen unveränderlich, da sie die singulären Werte nicht verändern. Wir erhalten also: wobei . Fortsetzung:Dies wird minimiert, wenn alle nicht diagonalen Elemente von Null sind und alle diagonalen Terme die größten Singularwerte [Lücke hier: dies ist nicht offensichtlich] auslöschen , dh und damit .

X-EINF=USV-EIN=S-UEINV=S-B,
B=UEINV
X-EINF=ichj(Sichj-Bichj)2=ich(sich-Bichich)2+ichjBichj2.
Bkksich A o p t i m a l = U k S k V kBOptichmeinl=SkEINOptichmeinl=UkSkVk
Amöbe sagt Reinstate Monica
quelle
2
Der Beweis im Fall der Frobeniius-Norm ist nicht korrekt (oder zumindest nicht vollständig), da das Argument hier nicht die Möglichkeit ausschließt, dass eine Matrix des gleichen Ranges einige der anderen diagonalen Terme auslöschen könnte, während sie "kleine" Abweichungen aufweist. Diagonalen. Um die Lücke deutlicher zu sehen, ist zu beachten, dass das Konstanthalten der Diagonalen und das "Nullsetzen" der Off-Diagonalen häufig den Rang der fraglichen Matrix erhöhen kann !
Kardinal
1
Beachten Sie auch, dass die SVD Beltrami (zumindest in einem ganz allgemeinen, wenn auch besonderen Fall) und Jordanien bereits 1874 bekannt war.
Kardinal
@ Kardinal: Hmmmm, ich bin mir nicht sicher, ob ich die Lücke sehe. Wenn einige andere diagonale Terme in anstelle von größten Termini aufhebt und stattdessen einige Terme ungleich Null außerhalb der Diagonale hat, dann sind beide Summen und , werden zunehmen. Es erhöht also nur den Rekonstruktionsfehler. Nein? Trotzdem habe ich versucht, einen anderen Beweis für die Frobenius-Norm in der Literatur zu finden, und habe gelesen, dass es sich irgendwie leicht aus dem Operator-Norm-Fall ergeben sollte. Aber bis jetzt sehe ich nicht, wie es folgen soll ...S k Σ i ( s i - B i i ) 2 Σ i j B 2 i jBSkich(sich-Bichich)2ichjBichj2
Amöbe sagt Reinstate Monica
3
Ich tun wie GW Stewart (1993), auf der Frühgeschichte der Einzelwertzerlegung, SIAM Bewertung , vol. 35, nein. 4, 551-566, und angesichts Ihres zuvor nachgewiesenen Interesses an historischen Angelegenheiten denke ich, dass Sie dies auch tun werden. Leider glaube ich, dass Stewart die Eleganz von Schmidts Beweis von 1907 ungewollt übertrieben ablehnt. Darin verbirgt sich eine Regressionsinterpretation, die Stewart übersieht und die wirklich sehr hübsch ist. Es gibt einen weiteren Beweis, der dem anfänglichen Diagonalisierungsansatz folgt, der jedoch zusätzliche Arbeit erfordert, um die Lücke zu füllen. (Fortsetzung)
Kardinal
2
@ cardinal: Ja, du hast recht, jetzt sehe ich auch die Lücke. Vielen Dank für die Stewart-Zeitung, die eine sehr interessante Lektüre war. Ich sehe, dass Stewart die Beweise von Schmidt und Weyl präsentiert, aber beide sehen komplizierter aus als das, was ich hier gerne kopieren würde (und bis jetzt hatte ich nicht die Zeit, sie sorgfältig zu studieren). Ich bin überrascht: Ich habe erwartet, dass dies ein sehr einfaches Ergebnis ist, aber es scheint weniger trivial zu sein, als ich dachte. Insbesondere hätte ich nicht erwartet, dass der Fall Frobenius so viel komplizierter ist als der der Betreibernorm. Ich werde den Beitrag jetzt bearbeiten. Frohes neues Jahr!
Amöbe sagt Reinstate Monica