Ich versuche, einige Verbraucherdaten zu visualisieren, die 4 Kategorien haben. Benutzer können zwischen verschiedenen Kategorien wechseln. Ich möchte die letzten drei oder vier Schalter für jede Person visualisieren.
Wir würden also mit einem Diagramm mit einer Spalte mit 4 gestapelten Proportionen beginnen. Danach hätten wir 16, da jede Kategorie in das unterteilt ist, was die Leute bei der vorherigen Gelegenheit getan haben, dann 64 und so weiter, bis die Behälter zu klein werden, um nützlich zu sein.
Ich denke, irgendwo zwischen einem Marimekko-Diagramm und einem gestapelten Barchart oder einem Dendro-Gramm sollte funktionieren, aber ich weiß nicht einmal, wie das heißen würde!
Wenn jemand bei der Art der Handlung helfen kann, die ich verwenden sollte, und wenn Sie besonders nett sein möchten, wie man sie in R implementiert, wäre ich sehr dankbar.
quelle
Antworten:
Eine mögliche Idee ist die Verwendung von Sankey-Diagrammen , um den Auswahlfluss zwischen den Kategorien zu dokumentieren. Zwei Beispiele, um zu beschreiben, wovon ich spreche, sind:
Mit einem Update über einige Ihrer Bedenken, die in den Kommentaren zum Ausdruck gebracht wurden. Es scheint mir, dass das Programm "Parallele Sätze" sofort das tut, was Sie wollen. Unten ist eine Ausgabe des Programms, in dem ich 4 Zufallsvariablen mit 4 Kategorien erstellt habe. Unabhängig davon, welche Gruppe Sie oben in der Anzeige initialisieren, wird sie nacheinander auf die nachfolgenden Kategorien aufgeteilt. Erstellen Sie die gewünschte Aufteilung.
Auch in diesem Bild nicht ersichtlich, verfügt das Paket über einige interaktive Funktionen, die eine einfachere explorative Datenanalyse ermöglichen, z. B. wenn Sie mit der Maus über eine der Kategorien fahren, werden alle Nachkommen hervorgehoben.
Ich habe denselben Datensatz auf Fineo hochgeladen, den Sie hier erkunden können . Neben den ersten 4 Kategorievariablen (benannt43
dec1
nachdec4
) habe ich auch die verketteten Kategorien aufgenommen, mit denen Sie die geteilten Kategorien untersuchen können. Die Namenskonvention für die Variablen mit demexp
Suffix lautet, dass es sich um diedec
Variable handelt, die durch Verketten der zuvor ausgewählten Kategorien erweitert wurde. Sodec3_exp12
würde markiert werden ,121
wenndec1 = 1 and dec2 = 2 and dec3 = 1
. Sie können in Fineo dieselbe Split-Typ-Struktur erstellen, die in ParSets verfügbar ist, in diesem Beispiel können jedoch die Kategorien mit oder mehr Knoten nicht gerendert werden .Nach dem Herumspielen mit Fineo ist es eine nette Anwendung, aber es ist wirklich begrenzt. Parallele Sets bieten viel mehr Funktionen, daher würde ich empfehlen, dass Sie dies vor der Fineo-App überprüfen.
Ich denke, das ParSets-Programm ist eine viel bessere Option als die sukzessive Aufteilung der Kategorien in Teilmengen zur Prüfung. In einem Beispiel, in dem dieselben Zufallsdaten wie oben verwendet werden, ist hier ein Punktdiagramm dargestellt, in dem die Proportionskategorien in der
decision 2
ausgewählten Bedingung abhängig von der ausgewählten Kategorie aufgetragen sinddecision 1
.Sie können dieselbe Aufschlüsselung für den Wechsel von
decision 2
zudecision 3
vornehmen, jedoch ein kleines Mehrfachdiagramm für die Initialedecision 1
erstellen.Sie können dies unendlich fortsetzen (siehe unten). Es mag aufschlussreich sein, aber ich vermute, es wäre ziemlich entmutigend, wenn Sie zu vielen weiteren Panels gelangen. Unten sehen Sie wie gewünscht 4 aufeinanderfolgende Kategorien.
Wie bereits erwähnt, sind die kleinen Zahlen zum Zeitpunkt der Aufteilung Ihrer Grafik in so viele Kategorien problematisch. Eine Möglichkeit, dies zu berücksichtigen, besteht darin, eine Ästhetik wie die Größe auf die Basislinie abzubilden, auf der der Anteil basiert. Dies verkleinert die Beobachtungen aufgrund kleinerer Zahlen aus der Sicht. Sie können auch Transparenz verwenden (aber ich habe die Punkte bereits transparent gemacht, um überzeichnete Punkte in diesem Beispiel zu unterscheiden).
Ich stelle mir vor, einige stellten sich eine weihnachtsbaumähnliche Knotenstruktur im Gegensatz zu Punktdiagrammen vor, aber ich weiß nicht, wie man eine solche Grafik erstellt. Ich vermute, es wäre das gleiche überwältigende Problem. Diese kleinen Vielfachen sind nicht schlecht, aber IMO the Parallel Sets ist viel intuitiver und ich vermute, dass einige nicht offensichtliche Muster in dieser Visualisierung offensichtlicher wären. Vielleicht kann jemand, der einfallsreicher ist als ich, interessantere Daten als nur 4 zufällige Kategorien liefern.
quelle