Ich habe Daten, die einen Aspekt des menschlichen Verhaltens darstellen. Ich möchte es (unbeaufsichtigt) in irgendeine Art von Verhaltensprofilen gruppieren. Jetzt sind einige meiner Variablen kategorisch (mit 2 oder mehr Kategorien) und einige sind kontinuierlich (die meisten sind Prozentsätze). Einige Variablen sind noch komplexer, da eine Kategorie weiter kontinuierlich ist und die andere keine solchen zusätzlichen Daten enthält.
Meine Frage ist, wie man diese Daten kategorisiert. Was sind die (üblichen?) Ansätze, die damit umgehen?
Ich brauche keinen Code oder irgendetwas, sondern einige Referenzen oder Anweisungen, die mir helfen, besser zu verstehen, wie ich mit dieser Herausforderung umgehen soll.
Wenn Sie R
Funktionen kennen, die eine solche Analyse ermöglichen, wäre das großartig, aber nicht notwendig.
Vielen Dank.
Antworten:
quelle
Das R-Paket finden Sie unter https://cran.r-project.org/web/packages/ClustOfVar
ClustOfVar
. Es scheint einige der besten verfügbaren Clustering-Methoden für Mischungen von Variablentypen zu implementieren.quelle