Was ist ein gutes Buch oder eine Referenz für die Datenvisualisierung?

7

Ich suche nach Referenzen zum Erstellen effektiver Grafiken / Datenvisualisierungen.

Ich habe eine Reihe von Büchern gefunden, die zeigen, wie Datenvisualisierungen mit bestimmten Tools (wie R / ggplot vs python / pandas) erstellt werden, aber das ist nicht wirklich das, wonach ich suche. Ich suche nach einer Referenz, die verschiedene Arten von Diagrammen in Bezug auf Statistiken / Mathematik erklärt. Ich möchte mehr Theorie als Prozess.

Ich möchte die verschiedenen Arten von Diagrammen kennen und wissen, wie man sie verwendet. Alles hilft!

Rico Kahler
quelle

Antworten:

11

Ich denke, dass die Arbeit von William Cleveland näher an der von Tufte sein wird. Cleveland schrieb zwei Bücher:

  1. Visualisierung von Daten (1993)
  2. Die Elemente der grafischen Darstellung von Daten (1985)

Insbesondere das erste Buch könnte das sein, was Sie wollen. Hier ist eine Beschreibung des Herausgebers:

Bei der Visualisierung von Daten handelt es sich um Visualisierungstools, die einen tiefen Einblick in die Struktur von Daten bieten. Es gibt grafische Werkzeuge wie Coplots, Mehrweg-Punktdiagramme und den Gleichzählungsalgorithmus. Es gibt Anpassungswerkzeuge wie Löss und Bisquadrat, die Gleichungen, nichtparametrische Kurven und nichtparametrische Oberflächen an Daten anpassen. Das Buch ist jedoch viel mehr als nur ein Kompendium nützlicher Werkzeuge. Es vermittelt eine Strategie für die Datenanalyse, bei der die Verwendung der Visualisierung zur gründlichen Untersuchung der Datenstruktur und zur Überprüfung der Gültigkeit der an Daten angepassten statistischen Modelle betont wird. Das Ergebnis der Tools und der Strategie ist eine enorme Steigerung dessen, was Sie aus Ihren Daten lernen können. Das Buch demonstriert dies, indem es viele Datensätze aus der wissenschaftlichen Literatur erneut analysiert und fehlende Effekte und unangemessene Modelle aufdeckt, die an Daten angepasst sind.

Ein noch theoretischeres Buch ist The Grammar of Graphics von Leland Wilkinson. Die Beschreibung:

Dieses Buch wurde für Statistiker, Informatiker, Geographen, Forscher und andere Personen geschrieben, die an der Visualisierung von Daten interessiert sind. Es bietet eine einzigartige Grundlage für die Erstellung nahezu aller quantitativen Grafiken in wissenschaftlichen Zeitschriften, Zeitungen, Statistikpaketen und Datenvisualisierungssystemen. Während die konkreten Ergebnisse dieser Arbeit mehrere Visualisierungssoftware-Bibliotheken waren, konzentriert sich dieses Buch auf die tiefen Strukturen, die bei der Erstellung quantitativer Grafiken aus Daten eine Rolle spielen. Welche Regeln gelten für die Erstellung von Kreisdiagrammen, Balkendiagrammen, Streudiagrammen, Funktionsdiagrammen, Karten, Mosaiken, und Radarkarten? Diejenigen, die weniger an den theoretischen und mathematischen Grundlagen interessiert sind, können sich immer noch ein Bild von der Fülle und Struktur des Systems machen, indem sie die zahlreichen und oft einzigartigen Farbgrafiken untersuchen, die es erzeugen kann. Die zweite Ausgabe ist fast doppelt so groß wie das Original, mit sechs neuen Kapiteln und einer umfassenden Überarbeitung. Ein Großteil des hinzugefügten Materials macht dieses Buch für Umfragekurse in Visualisierung und statistischen Grafiken geeignet.

Dieses Buch ist sehr theoretisch.

Peter Flom
quelle
2
2. Auflage des Elements- Buches 1994. Ich stimme dieser Billigung von Cleveland nachdrücklich zu. Tufte ist großartig, aber Cleveland spricht direkter und mit vielen technischen Details mit jedem statistisch Gesinnten. Ich werde hinzufügen, dass diese Bücher wirklich nicht in einem fundamentalen Sinne datieren.
Nick Cox
2
In Wilkinsons Buch gibt es eine übergreifende (oder untersteckte) Theorie, die am besten durch die Tatsache gelobt wird, dass Hadley Wickham bei der Gestaltung seiner ggplot2in R darauf aufgebaut hat. Aber es ist auch ein großartiges Buch zum Überspringen und Überfliegen.
Nick Cox
6

Schauen Sie sich die Buchreihe von Ed Tufte an. Sie werden von Wikipedia im Artikel https://en.wikipedia.org/wiki/Edward_Tufte behandelt .

  1. Die visuelle Anzeige quantitativer Informationen. 1983; Zweite Ausgabe 2001. Cheshire, CT: Graphics Press

  2. Informationen vorstellen. 1990. Cheshire, CT: Graphics Press

  3. Visuelle Erklärungen: Bilder und Mengen, Evidence and Narrative Graphics Press. 1997. Cheshire, CT: Graphics Press

  4. Schöne Beweise. 2006. Cheshire, CT: Graphics Press

Michael Chernick
quelle
Ich habe eine Referenz gegeben und meine Antwort ist nicht zu kurz.
Michael R. Chernick
1
Wir erwarten, dass Antworten auf "Listen" -Fragen wie diese mindestens einen zwingenden Grund für die Empfehlung enthalten. Antworten, die keine Gründe liefern, werden normalerweise gelöscht oder in Kommentare umgewandelt.
whuber
1
@whuber Ich gab eine sehr passende Antwort unter Bezugnahme auf die drei Bücher von Edward Tufte. Hast du einen besseren Vorschlag?
Michael R. Chernick
1
Ja. Geben Sie zunächst jedes Buch einzeln nach Titel an. Beschreiben Sie zusammen mit diesen Angaben, wie diese Buchempfehlung auf die Frage reagiert. Welche Theorie oder Theorien treibt Tufte voran? Aus welcher besonderen Perspektive? Warum lohnt es sich, diese Texte zu konsultieren? Wie unterscheiden sie sich untereinander? Etc., etc.
whuber
2
Ich habe das zweite von vier (bisher) von Tuftes selbstveröffentlichten Büchern hinzugefügt (beachten Sie, dass Grafiken in seinen früheren Büchern ein sekundäres Thema sind). Ich werde nicht versuchen, Michaels Lob zu unterstellen.
Nick Cox
5

Auf die Gefahr hin, gekreuzigt zu werden, würde ich von Tufte, Wilkinson, Cleveland usw. und allen anderen Klassikern abraten, wenn Sie gerade erst anfangen.

Der Grund ist das folgende von Ihnen festgelegte Ziel (Hervorhebung hinzugefügt):

Ich suche nach Referenzen zum Erstellen effektiver Grafiken / Datenvisualisierungen.

Auch wenn Sie keine explizit sprachabhängigen Bücher / Tutorials möchten, möchten Sie, dass Ihr Wissen angewendet wird und nicht eine abstrakte theoretische Übung beim Kaffee. Mit dem zu beginnen, was ich Klassiker nenne, ist wie Shakespeare zu lesen, weil Sie möchten, dass Ihre Sprache beredter ist. Die Diskussionen in den Büchern eignen sich hervorragend, um die Grundlagen für ein Verständnis einer effektiven Datenvisualisierung zu schaffen. Aber angesichts der technologischen Fortschritte bis heute sind die Bücher keine große Hilfe bei der Entwicklung der angewandten Denkweise (Grammatik der Grafik - Wilkinson ist die leichte Ausnahme, da sie relevant sind, ggplot2aber in diesem Fall würde ich empfehlen, Werke von Hadley Wickham zu lesen , stattdessen der Paketautor).

Einige gute Ressourcen, die Sie sich ansehen können, sind FlowingData (Nathan Yau), Perceptual Edge (Stephen Few) und Storytelling with Data (Cole Knaflic) sowie die Bücher der Blog-Autoren. Der Grund ist folgender:

  1. Diese Arbeiten umfassen bereits die Forschung der Klassiker
  2. Die Sprache ist weniger akademisch und leichter zu verstehen
  3. Die regelmäßig aktualisierten Blogs dienen als ergänzendes Material zu den Büchern

Schade, dass Aaron Koblin keine Bücher über seine einzigartige Sicht auf Visualisierungen großer Datenmengen veröffentlicht hat.

Ich schätze nicht ein, wie nützlich die Arbeit von Tufte, Cleveland und Wilkinson ist, aber nachdem ich einige davon durchgearbeitet hatte und mit modernen Datenvisualisierungstools nur unwesentlich besser umgehen konnte, war Stephen Fews "Show me the Numbers" wie ein Lichtschalter.

DivyaJyoti Rajdev
quelle
4

Dies hängt stark von der Sprache ab, die Sie bevorzugen. Da ich Python nicht häufig für die Datenvisualisierung verwende, kann ich Ihnen nur Bücher zur Datenvisualisierung in R empfehlen. Nachdem ich diesen Beitrag geschrieben habe, lese ich Ihre Frage und Nr. 1, Nr. 2 und vielleicht Nr. 4 könnte die theoretischste sein. Obwohl Nr. 6 erklärt Ihnen auch theoretische Aspekte, die auf die Visualisierung unbeaufsichtigter Techniken des maschinellen Lernens spezialisiert sind.

  1. R Grafiken von Paul Murrell

Der Autor Paul Murrell ist maßgeblich an der Entwicklung der Grafiken der R-Sprache beteiligt. Er entwickelte das Konzept "Grammatik der Grafik", das der ggplot2-Bibliothek zugrunde liegt. Das Buch ist ziemlich fortgeschritten, obwohl Sie nicht viel Vorwissen brauchen, das notwendig und ziemlich theoretisch ist. Es ist das beste Buch für Leute, die die Konzepte der Datenvisualisierung in R wirklich verstehen wollen, aber ich empfehle es nicht für Anfänger.

  1. HTML-Widgets

Ist ein Muss für die interaktive Datenvisualisierung. Verschiedene JavaScript-Bibliotheken werden in R übersetzt und an R angepasst. Sie können die meisten Widgets in RShiny, Markdown (als HTML gerendert) oder in der Konsole einfügen. Meine Lieblings-HTML-Widgets sind

  • Plotly (Eine Bibliothek zur interaktiven Datenvisualisierung, die auch für verschiedene andere Sprachen wie Python und Matlab verfügbar ist)
  • Faltblatt (interaktive Visualisierungen mit Karten)
  • Dygraph (bietet eine große Auswahl für die interaktive Zeitreihenvisualisierung)
  • datierbar (geschrieben von Yuhui Xe von RStudio, der auch das Strick- und das Bookdown-Paket geschrieben hat. Erfolgreich für das Anzeigen von Tabellen))

    1. Anleitung zum Erstellen schöner Grafiken in R.

Dieses Buch ist eher anfängerfreundlich. Die Beispiele sind hauptsächlich in ggplot2 dargestellt. Als ich anfing, fortgeschrittene Datenvisualisierungstechniken in RI zu lernen, verwendete ich hauptsächlich diese und die offizielle ggplot2-Website.

  1. Die offizielle ggplot2-Website

Ist der beste Ausgangspunkt, um ggplot2 zu lernen, aber es kann überwältigend erscheinen, wenn Sie nicht bereit sind, leidenschaftlich zu sein, und wenn Sie nicht viel Zeit haben. ggplot2 ist fantastisch, aber es kann eine steile Lernkurve haben, z. B. können Sie das "+" nicht am Anfang der Zeile schreiben. Alle theoretischen Konzepte werden ebenfalls erklärt.

  1. Offizielle Shiny Galerie

Shiny ist die am häufigsten verwendete R-Bibliothek zum Erstellen von Apps mit R. Sie kann durch BI-Tools wie Tableau oder Qlickview ersetzt werden. shinyjs ist eine großartige Erweiterung von shiny, die glänzend mit Javascript kombiniert. Sie können jedoch auch HTML, CSS und JavaScript selbst einbinden .

  1. Clusteranalyse in R.

Dieses Buch stammt von denselben Autoren wie der Leitfaden für schöne Grafiken (Nr . 3) . Es ist ein Fachbuch zur Visualisierung unbeaufsichtigter Techniken des maschinellen Lernens und insbesondere des Clustering.

7. Einfaches Tutorial

Für den Fall, dass Sie gerade anfangen zu visualisieren und ich Sie ein wenig überwältigt habe.

Ferdi
quelle