Probabilistische PCA
Probabilistische PCA ist ein latentes Gaußsches Variablenmodell der folgenden Form. Beobachtungen bestehen aus Variablen, latente Variablen bestehen vermutlich aus Variablen; Der Prior gegenüber latenten Variablen ist ein Gaußscher Mittelwert der Einheitskovarianz von Null: und die bedingte Verteilung der beobachteten Variablen unter Berücksichtigung der latenten Variablen ist
Es stellt sich heraus, dass die Maximum-Likelihood-Lösung für dieses Modell durch die ersten PCA-Komponenten der Daten gegeben ist: Spalten vonx∈RDDz∈RMM<D
z∼N(0,I),
x|z∼N(Wz+μ,σ2I).
MWML sind proportional zu den oberen Eigenvektoren der Kovarianzmatrix (Hauptachsen). Siehe Tipping & Bishop für Details.
Warum Gauß vor verwenden?
Für alle anderen früheren (oder zumindest für die meisten anderen Prioritäten) entspricht die Maximum-Likelihood-Lösung nicht der Standard-PCA-Lösung, sodass es keinen Grund gibt, dieses latente Variablenmodell als "probabilistische PCA" zu bezeichnen. Gaußscher Prior ist derjenige, der zu PCA führt.N(0,I)
Die meisten anderen Prioritäten würden das Problem viel komplizierter oder sogar analytisch unlösbarer machen. Eine Gaußsche Prior- und Gaußsche bedingte Verteilung führt zu einer Gaußschen Randverteilung , und es ist leicht zu erkennen, dass ihre Kovarianzmatrix durch . Nicht-Gaußsche Verteilungen sind viel schwieriger zu bearbeiten.p(x)W⊤W+σ2I
Eine Gaußsche Randverteilung ist ebenfalls attraktiv, da die Aufgabe der Standard-PCA darin besteht, die Kovarianzmatrix (dh den zweiten Moment) zu modellieren; PCA ist nicht an höheren Momenten der Datenverteilung interessiert. Die Gaußsche Verteilung wird vollständig durch die ersten beiden Momente beschrieben: Mittelwert und Kovarianz. Wir möchten keine komplizierteren / flexibleren Distributionen verwenden, da PCA diese Aspekte der Daten nicht behandelt.p(x)
Der Gaußsche Prior hat eine Einheitskovarianzmatrix, weil die Idee darin besteht, unkorrelierte latente Variablen zu haben, die die beobachteten Kovarianzen nur über Ladungen .W