Handelt es sich um Gitternetzlinien und grauen Hintergrund, und sollten sie nur ausnahmsweise verwendet werden?

26

Anscheinend stimmen die meisten Behörden darin überein, dass dunkle oder auf andere Weise hervorgehobene Gitternetzlinien in Plots nach vernünftiger Definition "Chartjunk" sind und den Betrachter von der Meldung im Hauptteil des Diagramms ablenken. Ich werde mich also nicht darum kümmern, diesbezüglich Hinweise zu geben.

Ebenso können wir uns alle einig , dass es Zeiten sein wird , die blass Rasterlinien eine Referenz zu schaffen für die Zuschauer wird notwendig sein. Tufte sprach sich gelegentlich für die Notwendigkeit (und Verwendung) von Gitternetzlinien aus, wie in diesem Artikel hervorgehoben . Und ich stimme dem Ansatz von Hadley Wickham in ggplot2 zu, solche Gitterlinien auf einem hellgrauen Hintergrund weiß zu machen, wenn Sie sie verwenden müssen.

Was mich jedoch unsicher macht, ist, ob solche Gitterlinien und grauer Hintergrund die Standardeinstellung sein sollen , wie sie in ggplot2 sind. Zum Beispiel scheint es keinen Grund für den grauen Hintergrund zu geben, außer die weißen Gitterlinien in Relief zu setzen - was die Frage aufwirft, ob beides benötigt wird. Ich habe vor kurzem begonnen, ggplot2 für die meisten meiner Grafikanforderungen zu verwenden, und finde es großartig, aber es hat meinen Ansatz "Keine Box, kein Hintergrund, keine Gitternetzlinien" für Grafiken in Frage gestellt, die ich zuvor verwendet habe. Früher war ich der Meinung, dass gridlines=OFFdies meine Standardeinstellung sein sollte, es sei denn, es gibt einen bestimmten Grund, sie hinzuzufügen - im Grunde die in diesem Artikel empfohlene Vorgehensweise .

Natürlich ist es unkompliziert, ein Thema in ggplot2 zu definieren, um Gitterlinien und Hintergrundschattierungen zu vermeiden (und das haben wir bei meiner Arbeit tatsächlich getan), aber der Ansatz von ggplot2 ist so fantastisch und im Allgemeinen sind seine ästhetischen Standardoptionen gut, dass ich mich frage, ob Mir fehlt etwas.

Also - ich wäre für Hinweise zu diesem Punkt dankbar. Ich bin mir sicher, dass es gut durchdacht ist (zum Beispiel von Hadley Wickham bei der Festlegung der Standardeinstellungen für ggplot2), und ich bin sehr offen dafür, in die richtige Richtung gezeigt zu werden. Das Beste, was ich finden konnte, sind ein paar Links in der ggplot2-Google-Gruppe, aber die hilfreichste Referenz von Cleveland ist unter dem angegebenen Link nicht verfügbar.

Peter Ellis
quelle
7
Persönlich mag ich (schwache) Gitternetzlinien aus dem offensichtlichen Grund - um das Abschätzen der mit Punkten auf der Zeichnung verbundenen Werte zu erleichtern.
mark999
7
Ab p. 141 von Hadleys Buch: "Wir können immer noch die Gitternetzlinien sehen, um die Beurteilung der Position zu erleichtern (Cleveland, 1993b), aber sie haben nur geringe visuelle Auswirkungen und wir können sie leicht" ausstimmen ". Der graue Hintergrund verleiht dem Plot eine ähnliche Farbe (im typografischen Sinne) für den Rest des Textes, um sicherzustellen, dass die Grafiken in den Textfluss passen, ohne mit einem hellen weißen Hintergrund herauszuspringen. Schließlich erzeugt der graue Hintergrund ein kontinuierliches Farbfeld, das die Darstellung gewährleistet wird als eine einzige visuelle Einheit wahrgenommen. "
mark999
4
Andrew Gelman hat viel über Infografiken gebloggt, ähnlich. Persönlich denke ich, dass Diagramme ohne Referenzlinien genauso schlecht sind wie kühne, ablenkende Gitter. Stilvoller und cooler, stört aber dennoch das Verständnis und unsere Fähigkeit, Informationen aufzuspüren. Die Idee ist nicht, minimalistisch zu sein, als wären wir alle skandinavische Möbeldesigner, sondern klar zu kommunizieren, was subtile (aber nützliche) Referenzlinien beinhalten sollte.
Wayne
3
Ich stelle fest, dass es hier eine Menge guter Diskussionen gibt, aber alle Kommentare - ich frage mich, inwieweit eine einzige, maßgebliche Antwort gegeben werden kann -, ich vermute, dass diese Frage als CW am besten wäre, und dann könnten wir uns bewegen (und näher erläutern) ) einige dieser guten Kommentare in Antworten.
gung - Reinstate Monica
1
Ich habe eine Antwort hinzugefügt, die auf einigen Kommentaren basiert und in Community-Wiki umgewandelt wurde
Peter Ellis

Antworten:

15

Eine Sache, die dazu beitragen kann, die Debatte voranzutreiben, besteht darin, anzuerkennen, warum Menschen visuell zwischen Hintergrund und Vordergrund unterscheiden, Lehren aus der Kartografie zu ziehen und sie allgemeiner auf statistische Grafiken anzuwenden.

Die Leute mögen anfänglich denken, dass Farbe ein gutes Indiz dafür ist, ob sich ein bestimmtes Objekt im Vordergrund oder im Hintergrund befindet, aber dies ist nicht der Fall. Nehmen Sie zum Beispiel das folgende Beispiel aus einem ESRI-Blogpost: " Karten zum Anschauen bringen": Fünf grundlegende Gestaltungsprinzipien für die Kartografie von Aileen Buckley.

Vordergrund Verwirrung

Wenn ich Sie also fragen würde, welche Zahl (z. B. Landmasse) und welche den Boden (z. B. Gewässer) darstellt, welche würden Sie auswählen? Ein ähnliches Phänomen tritt auch bei der optischen Täuschung der Rubin-Vase auf .

Einige experimentelle Untersuchungen, an die ich mich erinnere, in Alan MacEachrens How Maps Work gelesen zu haben, legen nahe, dass die Leute in den obigen Bildern die hellen und dunklen Bereiche in gleicher Häufigkeit für die Figur auswählen (offenbar werden Farbton und Sättigung verwendet, um die Figur vom Boden aus zu bestimmen). Die Farbe kann also nicht automatisch abgrenzen, ob der Hintergrund in einer statistischen Grafik mit dem Vordergrund konkurriert, aber andere Hinweise können Abhilfe schaffen.

Menschen assoziieren oft Figuren als eingeschlossene Objekte (dies ist ein Teil des Grundes, warum die obige Karte verwirrend ist, da keine Masse eingeschlossen ist). Dies legt im Allgemeinen nahe, dass (unabhängig von der Hintergrundfarbe) Elemente im Plot klar abgegrenzte Grenzen haben und Elemente im Plot dunkler als der Hintergrund sein sollten. Dies führt wahrscheinlich dazu, dass der De-facto-Plot-Hintergrund weiß wird, aber ein grauer Hintergrund ist nicht schädlich. Andere Aspekte können zur Abgrenzung zwischen Vordergrund und Hintergrund herangezogen werden (der ESRI-Blogbeitrag nennt einige davon).

Einer ist der verhasste Excel-Schlagschatten für Grafiken ( Beispiel in diesem Newsletter von Dan Carr in Abbildung 2). Dies sollte allerdings mit dem Vorbehalt einhergehen, dass Menschen die numerischen Attribute an der Stelle des Schattens anstelle des beabsichtigten Elements interpretieren können.

Zum anderen werden für die Kontur eines Elements im Plot andere Farben / Sättigung als für die Innenfüllung verwendet. Beispiele sind unten angegeben, wobei der äußerste linke Kreis ein Beispiel für eine nicht klar umrissene Grenze ist.

Füllen gegen Gliederung

Diese scheinen auch nicht erschöpfend zu sein. Bei Liniendiagrammen treten häufig dickere Linien in den Vordergrund, während dünnere Linien in den Hintergrund treten.

Dies ist jedoch hauptsächlich als Denkanstoß gedacht: Ihr Selbststudium scheint ziemlich erschöpfend zu sein (und ich danke Ihnen für einige der von Ihnen bereitgestellten Ressourcen!). Ich glaube nicht, dass ich mit den von Ihnen bereitgestellten Ressourcen nicht einverstanden bin. aber ich bin mir nicht sicher, was Hadley mit seiner Motivation für einen grau hinterlegten Hintergrund meint. Der persönlichen ästhetischen Vorliebe für graue Hintergründe kann jedoch Rechnung getragen werden, indem sichergestellt wird, dass die Elemente in der Handlung in den Vordergrund treten (darauf kommt es wirklich an). Diese Lektionen können auch auf Gitternetzlinien angewendet werden. Wenn Gitternetzlinien hilfreich und unauffällig sind (dh im Hintergrund), sind sie mit Sicherheit kein Chartjunk.

Andy W
quelle
5
Ich denke nicht, dass die Hauptfrage darin besteht, zwischen Hintergrund und Vordergrund zu unterscheiden - ich denke, das ist ziemlich einfach. Die eigentliche Herausforderung besteht darin, die Grafik so zu erstellen, dass die Vergleiche, an denen Sie interessiert sind, so einfach und genau wie möglich sind. Nach meiner Erfahrung erleichtern Gitterlinien das Ablesen und Vergleichen von Werten, obwohl ich dies nicht tue Haben Sie irgendwelche formellen Experimente, um dies zu belegen.
Hadley
@hadley, ich nahm an, dass die (Haupt-) Beschwerden über graue Hintergründe (und Gitternetzlinien) aufdringlich waren, was darauf hindeutet, dass sie mit den tatsächlichen Datenelementen in der Handlung um Aufmerksamkeit konkurrieren. Dies deutet auf eine Verwirrung zwischen Vordergrund und Hintergrund hin. Meine Annahmen könnten aber auch falsch sein (vielleicht sind es rein ästhetische Gründe, warum die Leute sie bevorzugen oder nicht mögen). Die Unterscheidung zwischen Vordergrund und Hintergrund mag einfach sein, aber ich glaube nicht, dass dies allgemein bekannt ist. Ich hoffe, dass mein Beitrag in dieser Hinsicht hilfreich sein wird.
Andy W
11

Professor Wickham schrieb im ggplot2-Buch:

"Wir können immer noch die Gitternetzlinien sehen, um die Positionsbestimmung zu erleichtern (Cleveland, 1993b), aber sie haben nur geringe visuelle Auswirkungen und wir können sie leicht" ausstimmen ". Der graue Hintergrund verleiht dem Plot eine ähnliche Farbe (in typografischem Sinne) ) Stellen Sie sicher, dass die Grafiken in den Textfluss passen, ohne mit einem hellen weißen Hintergrund herauszuspringen, und erstellen Sie durch den grauen Hintergrund ein kontinuierliches Farbfeld, das sicherstellt, dass die Zeichnung als eine einzige wahrgenommen wird visuelle Einheit. "

Und @ Wayne schrieb:

"Persönlich denke ich, dass Diagramme ohne Referenzlinien genauso schlecht sind wie kühne, ablenkende Raster. Sie sind stilvoller und cooler, beeinträchtigen aber immer noch das Verständnis und unsere Fähigkeit, Informationen aufzuspüren. Es geht nicht darum, minimalistisch zu sein, als ob wir waren alle skandinavischen Möbeldesigner, aber klar zu kommunizieren, was subtile (aber nützliche) Referenzlinien beinhalten sollte "

und @Peter Flom schrieb:

Ich denke, schwache Gitternetzlinien sollten die Standardeinstellung in einem Streudiagramm sein. sie helfen dem Leser; Ebenso helfen Leerzeichen zwischen Wörtern und Textzeilen dem Leser. Der graue Hintergrund gefällt mir allerdings nicht. Ich finde es ablenkend. Schließlich ist der Text in der Regel schwarz auf weißem Hintergrund.

Peter Ellis
quelle
3

Ich neige zwar dazu, den grauen Standardhintergrund zu meiden, aber ein Grund, warum Hadley sich für das Grau entschieden hat, besteht darin, dem Benutzer zu ermöglichen, mehr helle, gesättigte Farben für die Anzeige von Daten zu verwenden, die bei einem weißen Hintergrund möglicherweise nicht so effektiv erscheinen.

Nova
quelle
War dies als Antwort auf die Frage des OP, als Kommentar zur Klärung durch das OP oder einen der Beantworter oder als eigene neue Frage gedacht? Bitte verwenden Sie nur das Feld "Ihre Antwort", um Antworten auf die ursprüngliche Frage zu erhalten. Sie können überall kommentieren, wenn Ihr Ruf> 50 ist. Wenn Sie eine neue Frage haben, klicken Sie auf das graue ASK QUESTION Feld oben auf der Seite und stellen Sie sie dort. Wir können Ihnen dann richtig helfen.
gung - Wiedereinsetzung von Monica
2
Ich denke tatsächlich, dass dies zumindest teilweise eine Antwort auf die Frage darstellt: Es wird hier diskutiert, ob der graue Hintergrund Chart-Junk darstellt, und es wird begründet, warum dies möglicherweise nicht der Fall ist.
Silberfischchen
0

Persönlich bevorzuge ich das Dark-on-Light-Theme_bw oder sogar das Theme_minimal gegenüber dem Standard-Theme von ggplot2 - siehe http://docs.ggplot2.org/current/ggtheme.html .

Standardthema

Ich finde den grauen Hintergrund im Standardthema extrem störend - mein Auge ist eher auf die grauen Blöcke als auf die Punkte gerichtet. Passiert das noch jemandem? In der obigen Spielzeugdarstellung wird mein Auge häufig nach rechts unten gezogen (wo es keine Datenpunkte gibt).

(Wäre es nicht interessant, Eyetracking-Aufzeichnungen von Personen zu sehen, die sich diese Handlungen ansehen?)

Persönlich bevorzuge ich dies:

dunkel-auf-licht theme_bw

... aber es ist sehr subjektiv - ich denke nicht, dass es eine einzige Regel geben sollte, die jeder befolgen muss.

Code für diese Grundstücke:

library(ggplot2)

n <- 100
df <- data.frame(x=runif(n, max=10), epsilon=rnorm(n))
df$y <- 2 + df$x - 0.05*df$x^2 + df$epsilon

p1 <- (ggplot(df, aes(x=x, y=y)) +
       geom_point(size=3) +
       ggtitle("Default Theme"))
ggsave("default_theme_example.png", p1, width=10, height=8)

p2 <- (ggplot(df, aes(x=x, y=y)) +
       geom_point(size=3) +
       theme_bw() +
       theme(panel.border=element_blank()) +
       ggtitle("Custom Theme"))
ggsave("custom_theme_example.png", p2, width=10, height=8)
Adrian
quelle