Visualisierung aufeinanderfolgender Proportionen

9

Ich versuche, einige Verbraucherdaten zu visualisieren, die 4 Kategorien haben. Benutzer können zwischen verschiedenen Kategorien wechseln. Ich möchte die letzten drei oder vier Schalter für jede Person visualisieren.

Wir würden also mit einem Diagramm mit einer Spalte mit 4 gestapelten Proportionen beginnen. Danach hätten wir 16, da jede Kategorie in das unterteilt ist, was die Leute bei der vorherigen Gelegenheit getan haben, dann 64 und so weiter, bis die Behälter zu klein werden, um nützlich zu sein.

Ich denke, irgendwo zwischen einem Marimekko-Diagramm und einem gestapelten Barchart oder einem Dendro-Gramm sollte funktionieren, aber ich weiß nicht einmal, wie das heißen würde!

Wenn jemand bei der Art der Handlung helfen kann, die ich verwenden sollte, und wenn Sie besonders nett sein möchten, wie man sie in R implementiert, wäre ich sehr dankbar.

r data-visualization sankey-diagram Simon Hayward
quelle

Was ist mit Netzwerkanalyse? en.wikipedia.org/wiki/Social_network#Social_network_analysis

Roman Luštrik

Richtige Idee, aber falsche Daten dafür. Ich möchte eine Spalte mit Proportionen erhalten und dann jede Proportion iterativ aufschlüsseln, um die Vorgänger anzuzeigen.

Simon Hayward

1

Ist die Reihenfolge der Schalter relevant? Ich denke, dass Sie vielleicht nur 12 verschiedene Werte haben: die Zahl, die (zu jedem Zeitpunkt) von Kat.1 zu 2, 3 oder 4 Kat. Umgeschaltet hat. 2 bis 1, 3 oder 4 und so weiter. Dann könnten Sie dies mit vier Kreisen für die verschiedenen Kategorien und Pfeilen, die zwischen den Kreisen hin und her gehen, und der relativen Größe der Pfeile, die die Anzahl der Schalter anzeigen, visualisieren.

Jonathan

Wenn die Reihenfolge relevant ist, können Sie natürlich für jeden Zeitpunkt dieselbe Grafik erstellen. Die sich ändernde Größe der Kreise würde dann die Änderungen in jeder Kategorie im Laufe der Zeit anzeigen.

Jonathan

Antworten:

11

Eine mögliche Idee ist die Verwendung von Sankey-Diagrammen , um den Auswahlfluss zwischen den Kategorien zu dokumentieren. Zwei Beispiele, um zu beschreiben, wovon ich spreche, sind:

Fineo von DensityDesign
Parallele Sets von Robert Kosara. Auf einem der Poster auf dieser Website wurde auch gezeigt, wie parallele Sätze in R erstellt werden .

Mit einem Update über einige Ihrer Bedenken, die in den Kommentaren zum Ausdruck gebracht wurden. Es scheint mir, dass das Programm "Parallele Sätze" sofort das tut, was Sie wollen. Unten ist eine Ausgabe des Programms, in dem ich 4 Zufallsvariablen mit 4 Kategorien erstellt habe. Unabhängig davon, welche Gruppe Sie oben in der Anzeige initialisieren, wird sie nacheinander auf die nachfolgenden Kategorien aufgeteilt. Erstellen Sie die gewünschte Aufteilung.

Geben Sie hier die Bildbeschreibung ein

Auch in diesem Bild nicht ersichtlich, verfügt das Paket über einige interaktive Funktionen, die eine einfachere explorative Datenanalyse ermöglichen, z. B. wenn Sie mit der Maus über eine der Kategorien fahren, werden alle Nachkommen hervorgehoben.

Ich habe denselben Datensatz auf Fineo hochgeladen, den Sie hier erkunden können . Neben den ersten 4 Kategorievariablen (benannt dec1nach dec4) habe ich auch die verketteten Kategorien aufgenommen, mit denen Sie die geteilten Kategorien untersuchen können. Die Namenskonvention für die Variablen mit dem expSuffix lautet, dass es sich um die decVariable handelt, die durch Verketten der zuvor ausgewählten Kategorien erweitert wurde. So dec3_exp12würde markiert werden , 121wenn dec1 = 1 and dec2 = 2 and dec3 = 1. Sie können in Fineo dieselbe Split-Typ-Struktur erstellen, die in ParSets verfügbar ist, in diesem Beispiel können jedoch die Kategorien mit oder mehr Knoten nicht gerendert werden . $4^3$

Nach dem Herumspielen mit Fineo ist es eine nette Anwendung, aber es ist wirklich begrenzt. Parallele Sets bieten viel mehr Funktionen, daher würde ich empfehlen, dass Sie dies vor der Fineo-App überprüfen.

Ich denke, das ParSets-Programm ist eine viel bessere Option als die sukzessive Aufteilung der Kategorien in Teilmengen zur Prüfung. In einem Beispiel, in dem dieselben Zufallsdaten wie oben verwendet werden, ist hier ein Punktdiagramm dargestellt, in dem die Proportionskategorien in der decision 2ausgewählten Bedingung abhängig von der ausgewählten Kategorie aufgetragen sind decision 1.

Geben Sie hier die Bildbeschreibung ein

Sie können dieselbe Aufschlüsselung für den Wechsel von decision 2zu decision 3vornehmen, jedoch ein kleines Mehrfachdiagramm für die Initiale decision 1erstellen.

Geben Sie hier die Bildbeschreibung ein

Sie können dies unendlich fortsetzen (siehe unten). Es mag aufschlussreich sein, aber ich vermute, es wäre ziemlich entmutigend, wenn Sie zu vielen weiteren Panels gelangen. Unten sehen Sie wie gewünscht 4 aufeinanderfolgende Kategorien.

Geben Sie hier die Bildbeschreibung ein

Wie bereits erwähnt, sind die kleinen Zahlen zum Zeitpunkt der Aufteilung Ihrer Grafik in so viele Kategorien problematisch. Eine Möglichkeit, dies zu berücksichtigen, besteht darin, eine Ästhetik wie die Größe auf die Basislinie abzubilden, auf der der Anteil basiert. Dies verkleinert die Beobachtungen aufgrund kleinerer Zahlen aus der Sicht. Sie können auch Transparenz verwenden (aber ich habe die Punkte bereits transparent gemacht, um überzeichnete Punkte in diesem Beispiel zu unterscheiden).

Geben Sie hier die Bildbeschreibung ein

Ich stelle mir vor, einige stellten sich eine weihnachtsbaumähnliche Knotenstruktur im Gegensatz zu Punktdiagrammen vor, aber ich weiß nicht, wie man eine solche Grafik erstellt. Ich vermute, es wäre das gleiche überwältigende Problem. Diese kleinen Vielfachen sind nicht schlecht, aber IMO the Parallel Sets ist viel intuitiver und ich vermute, dass einige nicht offensichtliche Muster in dieser Visualisierung offensichtlicher wären. Vielleicht kann jemand, der einfallsreicher ist als ich, interessantere Daten als nur 4 zufällige Kategorien liefern.

Andy W.
quelle

Das sieht sehr hilfreich aus, danke.

Simon Hayward

1

@SimonHayward, poste einige Beispiele zurück, wenn du interessantere Visualisierungen hast.

Andy W

Hmmmm, eigentlich denke ich, dass das nicht funktionieren wird. Da die Klassen in jeder der 5 Kategorien gleich sind, werden Objekte wieder zusammen gruppiert, während ich möchte, dass sie sich immer feiner teilen. Also muss ich die Antwort aufheben! Ich kann deine Antwort im Mo nicht einmal bewerten! Aber der Beitrag war trotzdem interessant und nützlich!

Simon Hayward

Eine Art gerichteter Graph mit Knoten auf jeder Ebene, die sich aufteilen. Mit jedem Zweig gewichtet. Das Problem ist, dass ich den Namen meiner Anfrage nicht kenne, sodass die Frage schwer zu beantworten ist!

Simon Hayward

2

@ SimonHayward, ich habe mit ein paar weiteren Beispielen aktualisiert. Es scheint, dass die Anwendung "Parallele Sätze" im Gegensatz zur Fineo-Anwendung das gewünschte Verhalten aufweist.

Andy W