Tinten-Daten-Verhältnis und Plot-Hintergründe

17

Mir ist aufgefallen, dass viele "State-of-the-Art" -Plot-Pakete und -Themen und viele angesehene Data-Folks einen grauen Hintergrund für ihre Plots verwenden. Hier einige Beispiele:

ggplot2:

Bildbeschreibung hier eingeben

Nate Silver's fivethirtyeight.com:

Bildbeschreibung hier eingeben

Während im obigen ersten Beispiel (ggplot2) argumentiert werden kann, dass die Verwendung eines grauen Hintergrunds den für Rasterlinien erforderlichen Tintenverbrauch verringert, ist dies im zweiten Fall sicherlich nicht der Fall. Was sind die Vorteile von grauem Hintergrund gegenüber weißem oder transparentem Hintergrund?

David D
quelle
2
Ein Grundstück ist ein Gericht - grauer Hintergrund ist ein Teller.
TTNPHNS
3
@ttnphns Ich mag die Analogie. Hadley Wickham sagte über den Hintergrund von ggplot: "Der graue Hintergrund verleiht dem Plot eine ähnliche Farbe (in typografischem Sinne) wie dem Rest des Textes, wodurch sichergestellt wird, dass die Grafiken in den Textfluss passen, ohne mit einem hellen weißen Hintergrund herauszuspringen Schließlich erzeugt der graue Hintergrund ein kontinuierliches Farbfeld, das sicherstellt, dass die Handlung als eine einzige visuelle Einheit wahrgenommen wird. " Er begründete Gitternetzlinien auch damit, dass sie leicht "ausgeschaltet" werden können.
Silberfischchen
1
ttnphns Ihre Analogie gefällt mir auch sehr gut. @silverfish ja, genau richtig, mit der Grauskala, die zu einem Augenzwinkern passt, und vergleichen Sie das Plotquadrat mit dem Text auf der Seite. Hadley hat den grauen Hintergrund populär gemacht. Sein Design mit grauem Plothintergrund, aber weißem Hintergrund (Achsen) verdeutlicht, wo die Daten beginnen und enden. Und die Daten werden sichtbarer als das Hintergrundraster, das guten kognitiven Prinzipien folgt. Das Raster wird zurückgesetzt, bis Sie es zum Nachschlagen von Werten verwenden müssen.
Dianne Cook
3
@Silverfish Schauen Sie sich zunächst Jacques Bertin ( Semiologie Graphique ), Alan MacEachran (Funktionsweise von Karten ) und Lee Wilkinson ( Die Grammatik der Grafiken ) an. MacEachran bietet die vollständigen physiologischen, psychologischen und kulturellen Details mit zahlreichen Referenzen. Lassen Sie sich nicht vom Verweis auf "Karten" abschrecken: In seinem Buch geht es in erster Linie darum, wie Menschen mit Informationsgrafiken im Allgemeinen interagieren und ihnen Bedeutung verleihen, wofür Karten nur ein herausragendes Beispiel sind.
Whuber
1
@silverfish Es ist möglich , dass dan Carrs Arbeit, die den grauen Hintergrund und weiße Gitterlinien mit den Tabellen auf Parzellen mit begann in den frühen 90er Jahren arbeitet dev.bowdenweb.com/maps/m/using-gray-in-plots.pdf ist die Quelle der Idee. Ich kenne Hadley und habe darüber gesprochen. Aber die Analogie zur Grauskala des Textes ist Hadleys Erklärung.
Dianne Cook

Antworten:

18

Das Daten-Tinten-Verhältnis

Dieses Konzept geht auf den sehr einflussreichen Edward Tufte von der Yale University zurück, der es in The Visual Display of Quantitative Information beschrieb .

Er unterscheidet "Datentinte" (die Punkte, Balken usw., aber auch Text- oder Grafiketiketten enthält) von löschbarer Tinte (einschließlich Gitternetzlinien, Achsen, Rändern und auch redundanter Informationen). Das Daten-Tinten-Verhältnis ist einfach der Anteil der verwendeten Tinte, der nicht gelöscht werden kann.

Es wird diskutiert, wie diese Data-Ink-Prinzipien auf Computer-Visualisierungen auf der UX-Stack-Exchange-Site angewendet werden können .

Warum bevorzugen manche Experten einen grauen Hintergrund?

Hadley Wickham hat seine Wahl des Standardhintergrunds in seinem Buch über ggplot2 begründet:

Der graue Hintergrund verleiht dem Plot eine ähnliche Farbe (in typografischer Hinsicht) wie der Rest des Texts, wodurch sichergestellt wird, dass die Grafiken in den Textfluss passen, ohne mit einem hellen weißen Hintergrund herauszuspringen. Schließlich erzeugt der graue Hintergrund ein kontinuierliches Farbfeld, das sicherstellt, dass der Plot als eine einzige visuelle Einheit wahrgenommen wird.

Es scheint das Prinzip zu sein, zu verhindern, dass es auf einer gedruckten Seite auf den Betrachter "herausspringt" und für visuelle Einheit sorgt. Persönlich mag ich auch die reduzierte Blendung des Bildschirms.

Er begründete die weißen Gitterlinien auch damit, dass sie leicht "ausgeblendet" werden können. Ich stimme Dianne Cook in den Kommentaren zu, dass dies die Daten über den Gitternetzlinien hervorheben lässt und die visuelle Unordnung verringert. Die weißen Gitterlinien sind ein Vorteil eines etwas dunkleren Hintergrunds. Interessanterweise vermeidet Tufte im Allgemeinen Gitterlinien, bei denen sie nicht erforderlich sind (sie zählen nicht als " Datentinte "), bei einigen grauen Balkendiagrammen werden jedoch weiße Gitterlinien überlagert . In gewisser Hinsicht ähnelt dies dem Effekt ggplot2, stellt jedoch die Gitterlinien in den Vordergrund und verleiht den Balken ein "gestreiftes" Aussehen. Ein besonderer Nachteil ist, dass Sie die nächsthöhere Gitterlinie über einem Balken nicht sehen können.

Warum bevorzugen manche Experten einen weißen Hintergrund?

Einer der am häufigsten aufgerufenen ggplot2Threads bei Stack Overflow ist " Wie ändere ich die Hintergrundfarbe? ", Was darauf hindeutet, dass der Standard nicht allgemein verbreitet ist.

Die Farbe eines Elements kann sehr unterschiedlich aussehen, je nachdem, mit welcher Hintergrundfarbe es angezeigt wird. Tufte erörtert dies in Kapitel 5 "Farbe und Information" in seinem Buch " Informationen vorstellen" , stellt dies jedoch nicht in den Kontext eines Streudiagramms. Maureen Stone, eine Farbexpertin und außerordentliche Professorin an der Simon Fraser University, empfiehlt nachdrücklich einen weißen Hintergrund aus verschiedenen Gründen, einschließlich der Tatsache, dass die meisten Farbpaletten (in Ihren Beispielen zur Angabe der Art oder Unterteilung) mit einem weißen Hintergrund (z Druck) im Auge behalten. Ihre Wahrnehmungseigenschaften unterscheiden sich vor einem dunkleren Hintergrund. Sie schlägt vor, dass Weiß einen Wahrnehmungsvorteil hat, weil unsere Farbwahrnehmung relativ zu "lokalem" Weiß istWenn ein weißer Hintergrund visuell verfügbar ist, kann dies unsere Wahrnehmung stabilisieren.

Sie schlägt auch einen praktischeren Grund vor, den ich kenne: Wenn Sie einen weißen Hintergrund verwenden, können Sie ein Diagramm sowohl für die elektronische Anzeige als auch für den Druck optimieren , anstatt eine andere druckerfreundliche Version erstellen zu müssen.

Silberfisch
quelle
2
+1 für das Malen (sozusagen) beider Seiten der Ausgabe. Ich hatte Hadleys Argumentation gehört, aber Stone * Frasers nicht gehört. Vielen Dank!
Wayne
8

Solange der Hintergrund hell genug ist, um einen guten Kontrast zu den Datenmarken zu bieten, ist es meistens eine Frage der Ästhetik, ob er weiß oder hellgrau ist. Während die Hintergrundfarbe in gewissem Sinne "Tinte" ist, denke ich nicht, dass sie logischerweise als "Tinte" zählt. Es gibt keine proportionale Ablenkung von einem festen hellgrauen Feld.

Umgekehrt zählen die Gitterlinien in beiden Fällen als logische "Tinte". Obwohl die weißen Gitterlinien keine Tinte zum Drucken verbrauchen würden, brechen sie den Hintergrund auf und erzeugen zusätzliche visuelle Verarbeitungsarbeit. Ich würde sagen, die 538 Rasterlinien verbrauchen weniger logische Tinte, weil sie weniger Kontrast haben.

xan
quelle
"Ich würde sagen, die 538 Gitterlinien verbrauchen weniger logische Tinte ..." - Ich stimme zu, ich finde die Standardgitterlinien von ggplot2 extrem störend. Im Beispiel ggplot2 oben in der Frage des OP sind meine Augen eher auf die Gitterlinien als auf die Daten gerichtet.
Adrian