Als ich Wikipedia über die kanonische Korrelationsanalyse (CCA) für zwei Zufallsvektoren und las, fragte ich mich, ob die Hauptkomponenten-Anslysis (PCA) mit CCA identisch ist, wenn ?
9
Als ich Wikipedia über die kanonische Korrelationsanalyse (CCA) für zwei Zufallsvektoren und las, fragte ich mich, ob die Hauptkomponenten-Anslysis (PCA) mit CCA identisch ist, wenn ?
vectors X and Y
Sind das zwei Variablen (Datenspalten) oder zwei Fälle (Zeilen); vorausgesetzt, wir werden die Analysen von Variablen durchführen. 2)X and Y are the same
Wollten Sie sagen, dass X = Y oder anders herum?Antworten:
Let sein und sein Datenmatrizen, die zwei Datensätze mit Proben (dh Beobachtungen des Zufallszeilenvektoren und ) in jedem von ihnen.X n×p1 Y n×p2 n X Y
CCA sucht nach einer linearen Kombination von Variablen in und einer linearen Kombination von Variablen in so dass sie maximal miteinander korreliert sind. dann sucht es nach dem nächsten Paar unter einer Bedingung der Nullkorrelation mit dem ersten Paar; etc.p1 X p2 Y
Im Fall von (und ) hat jede lineare Kombination in einem Datensatz trivial die Korrelation mit derselben linearen Kombination in einem anderen Datensatz. Alle CCA-Paare haben also Korrelationen , und die Reihenfolge der Paare ist beliebig. Die einzige verbleibende Einschränkung besteht darin, dass lineare Kombinationen nicht miteinander korreliert werden sollten. Es gibt eine unendliche Anzahl von Möglichkeiten zu wählen unkorreliert Linearkombinationen (beachten Sie, dass die Gewichte nicht nicht sein müssen orthogonal in dem - dimensionalen Raum) und einer von ihnen wird eine gültige CCA - Lösung. Ein solcher Weg wird in der Tat von PCA angegeben, da zwei beliebige PCs die Korrelation Null haben.X=Y p1=p2=p 1 1 p p
Die PCA-Lösung wird zwar eine gültige CCA-Lösung sein, aber in diesem Fall gibt es unendlich viele gleichwertige CCA-Lösungen.
Mathematisch sucht CCA nach rechten ( ) und linken ( ) Singularvektoren von , was in diesem Fall gleich , wobei jeder Vektor ein Eigenvektor ist. So kann beliebig sein. CCA erhält dann die linearen Kombinationsgewichte als und . In diesem Fall läuft es darauf hinaus, eine beliebige Basis zu nehmen und sie mit transformieren , was tatsächlich unkorrelierte Richtungen erzeugt .a b C−1/2XXCXYC−1/2YY I a=b C−1/2XXa C−1/2YYb C−1/2XX
quelle