Wie kombiniere ich PCA und MCA mit gemischten Daten?

9

Angenommen, ich habe gemischte Daten und (Python-) Code, der PCA (Hauptkomponentenanalyse) für kontinuierliche Prädiktoren und MCA (Multiple Correspondence Analysis) für nominale Prädiktoren ausführen kann. Ist es möglich, Ergebnisse von PCA und MCA in einem zu kombinieren?

Wojciech Migda
quelle

Antworten:

8

Möglicherweise möchten Sie die Faktoranalyse gemischter Daten verwenden .

Sie können damit die Dimensionsreduzierung für einen vollständigen Datensatz durchführen.

Die AR-Implementierung finden Sie im FactoMineR-Paket. Diese Funktion hat jedoch Probleme, wenn Sie eine hohe Anzahl von Daten / Spalten haben.

Mir ist die Existenz des Äquivalents in Python nicht bekannt.

YCR
quelle
Vielen Dank, ich habe bereits über FAMD gelesen, das leider nur R-Unterstützung zu haben scheint - daher meine Frage. Das Mindeste, was ich jetzt tun kann, ist, die Ergebnisse beider Methoden (PCA & MCA) getrennt zu behandeln. Wenn es jedoch eine Möglichkeit gibt, sie zu einem monolithischen Datensatz zu mischen, ist dies die Antwort, nach der ich suche.
Wojciech Migda
Ok, es stellte sich heraus, dass mein Dataset groß genug ist, um der vorliegenden MCA-Implementierung den Speicherplatz zu verlieren.
Wojciech Migda
Dies ist ein wiederkehrendes Problem, das ich bei der R-Implementierung bekomme. Wenn Sie nur eine begrenzte Anzahl von Variablen haben, versuchen Sie, Ihre Beobachtungen zu gewichten. Oder verwenden Sie nur einen Teil Ihrer Beobachtung. Andernfalls könnten Sie versuchen, Ihre numerische Variable in eine Ordnungskategorie oder Ihre qualitativen Variablen in Flags umzuwandeln.
YCR
3

Die FAMD-Implementierung für Python finden Sie hier .

Hajar Homayouni
quelle
1

Ich habe in Python nach dem gleichen gesucht und bin auf das Prince- Paket gekommen, das FAMD implementiert hat.

Edo
quelle
1

Ich habe nicht genug Punkte, um einen Kommentar abzugeben. Wenn ich hier antworte, enthält @Edo prince Package nur CA-, MCA- und PCA-PAckages. Ich sehe hier keine FAMD.

dir(prince)

['CA', 'MCA', 'PCA', '__builtins__', '__cached__', '__doc__', '__file__', '__loader__', '__name__', '__package__', '__path__', '__spec__', '__version__', 'ca', 'mca', 'pca', 'plot', 'svd']
S_Ymln
quelle