Die kanonische Korrelationsanalyse (CCA) zielt darauf ab, die übliche Pearson-Produkt-Moment-Korrelation (dh den linearen Korrelationskoeffizienten) der linearen Kombinationen der beiden Datensätze zu maximieren.
Betrachten wir nun die Tatsache, dass dieser Korrelationskoeffizient nur lineare Assoziationen misst - genau aus diesem Grund verwenden wir beispielsweise auch Spearman- rho- oder Kendall- Korrelationskoeffizienten (Rang), die beliebige monotone (nicht notwendigerweise lineare) Koeffizienten messen. Verbindung zwischen Variablen.
Daher dachte ich an Folgendes: Eine Einschränkung von CCA ist, dass es aufgrund seiner objektiven Funktion nur versucht, die lineare Assoziation zwischen den gebildeten linearen Kombinationen zu erfassen. Wäre es nicht möglich, die CCA in gewissem Sinne zu erweitern, indem Sie beispielsweise Spearman- anstelle von Pearson- maximieren ?
Würde ein solches Vorgehen zu statistisch interpretierbaren und aussagekräftigen Ergebnissen führen? (Ist es zum Beispiel sinnvoll, CCA auf Rängen durchzuführen ...?) Ich frage mich, ob es helfen würde, wenn es sich um nicht normale Daten handelt ...
quelle
Antworten:
Bei der Berechnung kanonischer Variablen habe ich eingeschränkte kubische Spline-Erweiterungen verwendet. Sie fügen der Analyse nichtlineare Basisfunktionen genau so hinzu, wie Sie neue Features hinzufügen würden. Dies führt zu einer nichtlinearen Hauptkomponentenanalyse. Siehe das R -
Hmisc
Paket ‚s -transcan
Funktion für ein Beispiel. Das R-homals
Paket geht noch viel weiter.quelle
Die Standardmethode der CCA arbeitet mit der Produktmomentkorrelationskoeffizientenmatrix. Für die größte mg CC werden zwei zusammengesetzte Variablen z1 (n) und z2 (n) durch lineare Kombination von zwei Matixen (mit n Zeilen und Variablen m1 und m2) so konstruiert, dass abs (Korrelation (z1, z2)) maximiert wird. Diese Zielfunktion kann direkt maximiert werden, auch wenn die Korrelation (z1, z2) kein Produktmoment ist, sondern anders definiert ist.
Mishra, SK (2009) "Eine Anmerkung zur ordinalen kanonischen Korrelationsanalyse von zwei Sätzen von Ranglistenwerten"
http://papers.ssrn.com/sol3/papers.cfm?abstract_id=1328319
quelle