Ich muss Informationen über die wichtigsten Prädiktoren für die Stimmen eines Kandidaten anhand von Umfragedaten zur öffentlichen Meinung präsentieren. Ich habe eine logistische Regression mit allen Variablen durchgeführt, die mir wichtig sind, aber ich kann keine gute Möglichkeit finden, diese Informationen darzustellen.
Mein Kunde kümmert sich nicht nur um die Größe des Effekts, sondern auch um die Wechselwirkung zwischen der Größe des Effekts und der Größe der Population mit einem solchen Attribut.
Wie kann ich damit in einer Grafik umgehen? Irgendwelche Vorschläge?
Hier ist ein Beispiel:
logistic
data-visualization
survey
user1172558
quelle
quelle
Antworten:
Ich stimme @PeterFlom zu, dass das Beispiel seltsam ist, aber abgesehen davon stelle ich fest, dass die erklärende Variable kategorisch ist. Wenn dies durchweg zutrifft, wird dies erheblich vereinfacht. Ich würde Mosaikdiagramme verwenden , um diese Effekte darzustellen. Ein Mosaikplot zeigt bedingte Proportionen vertikal an, aber die Breite jeder Kategorie wird relativ zu ihrem marginalen (dh bedingungslosen) Anteil in der Stichprobe skaliert.
Hier ist ein Beispiel mit den Daten der Titanic-Katastrophe, die mit R erstellt wurden:
Links sehen wir, dass Frauen viel häufiger überleben, aber Männer machen vielleicht etwa 80% der Menschen an Bord aus. Eine Erhöhung des Prozentsatzes männlicher Überlebender hätte also viel mehr Leben gerettet als eine noch größere Erhöhung des Prozentsatzes weiblicher Überlebender. Dies ist etwas analog zu Ihrem Beispiel. Auf der rechten Seite gibt es ein weiteres Beispiel, bei dem die Besatzung und die Steuerung den größten Anteil an Menschen ausmachten, aber die geringste Überlebenswahrscheinlichkeit hatten. (Für das, was es wert ist, ist dies keine vollständige Analyse dieser Daten, da Klasse und Geschlecht auf der Titanic ebenfalls nicht unabhängig waren, aber es reicht aus, um die Ideen für diese Frage zu veranschaulichen.)
quelle
Ich bin ein wenig neugierig, welche Gesellschaft nur 10% Männer hatte ... aber ...
Eine Sache, die Sie tun können, ist, die Quotenverhältnisse zu zeichnen und sie jeweils mit der Größe der Stichprobe zu kennzeichnen.
Wenn beide Variablen grafisch dargestellt werden sollen, können Sie ein Blasendiagramm erstellen, bei dem die Position jeder Blase auf der y-Achse mit der Größe des Quotenverhältnisses und der Fläche der Blase proportional zur Stichprobengröße übereinstimmt.
quelle