Diese Frage ergibt sich aus der Diskussion nach einer vorherigen Frage: Welche Verbindung besteht zwischen partiellen kleinsten Quadraten, reduzierter Rangregression und Hauptkomponentenregression?
Für die Hauptkomponentenanalyse ist ein häufig verwendetes Wahrscheinlichkeitsmodell wobei , \ mathbf {w} \ in S ^ {p-1} , \ lambda> 0 und \ boldsymbol \ epsilon \ sim \ mathcal N (0, \ mathbf {I} _p) . Dann wird die Population Kovarianz \ mathbf {x} ist \ lambda \ mathbf {w} \ mathbf {w} ^ T + \ mathbf {I} _p , dh \ mathbf {x} \ sim \ mathcal N (0, \ lambda \ mathbf {w} \ mathbf {w} ^ T + \ mathbf {I} _p). Das Ziel ist es, \ mathbf {w} zu schätzen
Wie in der Antwort auf die vorherige Frage von @amoeba ausgeführt, haben reduzierte Rangregression, partielle kleinste Quadrate und kanonische Korrelationsanalyse eng verwandte Formulierungen.
Die Frage ist, welche Wahrscheinlichkeitsmodelle stehen hinter RRR, PLS und CCA? Insbesondere denke ich anWie hängt von und in RRR, PLS und CCA ab? Gibt es darüber hinaus ein einheitliches Wahrscheinlichkeitsmodell (wie das Spikeed-Covarianz-Modell für PCA) für sie?
quelle
Antworten:
Die probabilistische kanonische Korrelationsanalyse (probabilistische CCA, PCCA) wurde in Bach & Jordan, 2005, eingeführt. Eine probabilistische Interpretation der kanonischen Korrelationsanalyse , einige Jahre nachdem Tipping & Bishop ihre probabilistische Hauptkomponentenanalyse (probabilistische PCA, PPCA) vorgestellt hatte.
Kurz gesagt basiert es auf dem folgenden Wahrscheinlichkeitsmodell:
Hier sind Rauschkovarianzen und beliebige symmetrische Matrizen mit vollem Rang.Ψx Ψy
Wenn wir die eindimensionale latente Variable , annehmen, dass alle Mittel Null sind , und und zu einem Vektor kombinieren , erhalten wir:z μx=μy=0 x y
Bach & Jordan haben bewiesen, dass dies dem Standard-CCA entspricht. Insbesondere ist die Maximum Likelihood (ML) -Lösung gegeben durch wobei Beispielkovarianzmatrizen beider Datensätze sind, das erste kanonische Achsenpaar ist und willkürlich sind Zahlen (beide zwischen und ) geben die erste kanonische Korrelation als Produkt an.
Wie Sie sehen, sind nicht direkt gleich den CCA-Achsen, sondern werden durch eine Transformation dieser Achsen gegeben. Siehe Bach & Jordan für weitere Details.wi
Ich habe kein gutes intuitives Verständnis von PCCA. Wie Sie sehen können, wird die zwischen und durch modelliert , so dass man naiv erwarten könnte, dass eher PLS-Achsen ergibt. Die ML-Lösung bezieht sich jedoch auf die CCA-Achsen. Es liegt wahrscheinlich irgendwie an der Struktur von .X Y wxw⊤y wi Ψ=(Ψx00Ψy)
Mir sind keine ähnlichen probabilistischen Versionen von RRR oder PLS bekannt, und ich habe mir selbst keine ausgedacht. Beachten Sie, dass wenn diagonal ist, wir FA für den kombinierten Datensatz erhalten, und wenn es diagonal und isotrop ist, erhalten wir PPCA für den kombinierten Datensatz. Es gibt also einen Fortschritt von CCA über FA zu PPCA, da immer enger wird. Ich sehe nicht, welche anderen Möglichkeiten von vernünftig sein können.Ψ X+Y Ψ Ψ
quelle