Was sind gute Möglichkeiten, um Likert-Antworten zu visualisieren?
Zum Beispiel eine Reihe von Elementen, die nach der Wichtigkeit von X für Entscheidungen über A, B, C, D, E, F und G fragen? Gibt es etwas Besseres als gestapelte Balkendiagramme?
- Was ist mit Antworten von N / A zu tun? Wie könnten sie vertreten sein?
- Sollten in den Balkendiagrammen Prozentsätze oder die Anzahl der Antworten angegeben werden? (dh sollten die Balken die gleiche Länge haben?)
- Wenn Prozentsätze, sollte der Nenner ungültige und / oder nicht zutreffende Antworten enthalten?
Ich habe meine eigenen Ansichten, aber ich suche nach Ideen anderer Leute.
R
Benutzer hinzufügen , dass diese Art von Plots im Paket implementiert sindHH
. Um Ihnen einen Eindruck zu vermitteln, können Sie es versuchenlikert(t(apply(data, 2, table)))
.Gestapelte Balkendiagramme sind im Allgemeinen für Nicht-Statistiker gut verständlich, sofern sie vorsichtig eingeführt werden. Es ist nützlich, sie auf einer gemeinsamen Metrik (z. B. 0-100%) mit einer abgestuften Farbe für jede Kategorie zu skalieren, wenn es sich um ordinale Elemente handelt (z. B. Likert). Ich bevorzuge Punktdiagramme (Cleveland Dot Plot), wenn es nicht zu viele Elemente und nicht mehr als 3-5 Antwortkategorien gibt. Aber es geht wirklich um visuelle Klarheit. Ich gebe im Allgemeinen% an, da es sich um eine standardisierte Kennzahl handelt, und gebe nur% und Anzahl mit nicht gestapeltem Balkendiagramm an. Hier ist ein Beispiel für das, was ich meine:
Besseres Rendering könnte mit
lattice
oder erreicht werdenggplot2
. In diesem Beispiel weisen alle Elemente die gleichen Antwortkategorien auf. Im Allgemeinen werden jedoch möglicherweise unterschiedliche Kategorien erwartet, sodass die Anzeige aller Elemente nicht überflüssig erscheint, wie dies hier der Fall ist. Es wäre jedoch möglich, jeder Antwortkategorie dieselbe Farbe zuzuweisen, um das Lesen zu erleichtern.Ich würde jedoch sagen, dass gestapelte Balkendiagramme besser sind, wenn alle Elemente dieselbe Antwortkategorie aufweisen, da sie dazu beitragen, die Häufigkeit einer Antwortmodalität für mehrere Elemente zu schätzen:
Ich kann mir auch eine Art Heatmap vorstellen, die nützlich ist, wenn es viele Elemente mit ähnlichen Antwortkategorien gibt.
Fehlende Antworten (insbesondere, wenn sie nicht zu vernachlässigen sind oder sich auf einen bestimmten Artikel / eine bestimmte Frage beziehen) sollten im Idealfall für jeden Artikel gemeldet werden. Im Allgemeinen wird der Prozentsatz der Antworten für jede Kategorie ohne NA berechnet. Dies wird normalerweise in Umfragen oder in der Psychometrie gemacht (wir sprechen von "ausgedrückten oder beobachteten Antworten").
PS Ich kann mir ausgefallenere Dinge vorstellen, wie das unten gezeigte Bild (das erste wurde von Hand gemacht, das zweite stammt von
ggplot2
,ggfluctuation(as.table(tab))
), aber ich denke nicht, dass es so genaue Informationen wie Punktdiagramme oder Balkendiagramme liefert, da Oberflächenvariationen schwierig sind schätzen.quelle
Ich finde die Antwort von chl großartig.
Eine Sache, die ich hinzufügen könnte, ist für den Fall, dass Sie die Korrelation zwischen den Elementen vergleichen möchten. Dafür können Sie so etwas wie eine Korrelationsstreudiagramm-Matrix für geordnete kategoriale Daten verwenden
(Dieser Code muss noch etwas verbessert werden - aber er gibt die allgemeine Vorstellung ...)
quelle
pairs.panels
Funktion impsych
Paket von W Revelle.