Ich denke, dass die Arbeit von William Cleveland näher an der von Tufte sein wird. Cleveland schrieb zwei Bücher:
- Visualisierung von Daten (1993)
- Die Elemente der grafischen Darstellung von Daten (1985)
Insbesondere das erste Buch könnte das sein, was Sie wollen. Hier ist eine Beschreibung des Herausgebers:
Bei der Visualisierung von Daten handelt es sich um Visualisierungstools, die einen tiefen Einblick in die Struktur von Daten bieten. Es gibt grafische Werkzeuge wie Coplots, Mehrweg-Punktdiagramme und den Gleichzählungsalgorithmus. Es gibt Anpassungswerkzeuge wie Löss und Bisquadrat, die Gleichungen, nichtparametrische Kurven und nichtparametrische Oberflächen an Daten anpassen. Das Buch ist jedoch viel mehr als nur ein Kompendium nützlicher Werkzeuge. Es vermittelt eine Strategie für die Datenanalyse, bei der die Verwendung der Visualisierung zur gründlichen Untersuchung der Datenstruktur und zur Überprüfung der Gültigkeit der an Daten angepassten statistischen Modelle betont wird. Das Ergebnis der Tools und der Strategie ist eine enorme Steigerung dessen, was Sie aus Ihren Daten lernen können. Das Buch demonstriert dies, indem es viele Datensätze aus der wissenschaftlichen Literatur erneut analysiert und fehlende Effekte und unangemessene Modelle aufdeckt, die an Daten angepasst sind.
Ein noch theoretischeres Buch ist The Grammar of Graphics von Leland Wilkinson. Die Beschreibung:
Dieses Buch wurde für Statistiker, Informatiker, Geographen, Forscher und andere Personen geschrieben, die an der Visualisierung von Daten interessiert sind. Es bietet eine einzigartige Grundlage für die Erstellung nahezu aller quantitativen Grafiken in wissenschaftlichen Zeitschriften, Zeitungen, Statistikpaketen und Datenvisualisierungssystemen. Während die konkreten Ergebnisse dieser Arbeit mehrere Visualisierungssoftware-Bibliotheken waren, konzentriert sich dieses Buch auf die tiefen Strukturen, die bei der Erstellung quantitativer Grafiken aus Daten eine Rolle spielen. Welche Regeln gelten für die Erstellung von Kreisdiagrammen, Balkendiagrammen, Streudiagrammen, Funktionsdiagrammen, Karten, Mosaiken, und Radarkarten? Diejenigen, die weniger an den theoretischen und mathematischen Grundlagen interessiert sind, können sich immer noch ein Bild von der Fülle und Struktur des Systems machen, indem sie die zahlreichen und oft einzigartigen Farbgrafiken untersuchen, die es erzeugen kann. Die zweite Ausgabe ist fast doppelt so groß wie das Original, mit sechs neuen Kapiteln und einer umfassenden Überarbeitung. Ein Großteil des hinzugefügten Materials macht dieses Buch für Umfragekurse in Visualisierung und statistischen Grafiken geeignet.
Dieses Buch ist sehr theoretisch.
ggplot2
in R darauf aufgebaut hat. Aber es ist auch ein großartiges Buch zum Überspringen und Überfliegen.Schauen Sie sich die Buchreihe von Ed Tufte an. Sie werden von Wikipedia im Artikel https://en.wikipedia.org/wiki/Edward_Tufte behandelt .
Die visuelle Anzeige quantitativer Informationen. 1983; Zweite Ausgabe 2001. Cheshire, CT: Graphics Press
Informationen vorstellen. 1990. Cheshire, CT: Graphics Press
Visuelle Erklärungen: Bilder und Mengen, Evidence and Narrative Graphics Press. 1997. Cheshire, CT: Graphics Press
Schöne Beweise. 2006. Cheshire, CT: Graphics Press
quelle
Auf die Gefahr hin, gekreuzigt zu werden, würde ich von Tufte, Wilkinson, Cleveland usw. und allen anderen Klassikern abraten, wenn Sie gerade erst anfangen.
Der Grund ist das folgende von Ihnen festgelegte Ziel (Hervorhebung hinzugefügt):
Auch wenn Sie keine explizit sprachabhängigen Bücher / Tutorials möchten, möchten Sie, dass Ihr Wissen angewendet wird und nicht eine abstrakte theoretische Übung beim Kaffee. Mit dem zu beginnen, was ich Klassiker nenne, ist wie Shakespeare zu lesen, weil Sie möchten, dass Ihre Sprache beredter ist. Die Diskussionen in den Büchern eignen sich hervorragend, um die Grundlagen für ein Verständnis einer effektiven Datenvisualisierung zu schaffen. Aber angesichts der technologischen Fortschritte bis heute sind die Bücher keine große Hilfe bei der Entwicklung der angewandten Denkweise (Grammatik der Grafik - Wilkinson ist die leichte Ausnahme, da sie relevant sind,
ggplot2
aber in diesem Fall würde ich empfehlen, Werke von Hadley Wickham zu lesen , stattdessen der Paketautor).Einige gute Ressourcen, die Sie sich ansehen können, sind FlowingData (Nathan Yau), Perceptual Edge (Stephen Few) und Storytelling with Data (Cole Knaflic) sowie die Bücher der Blog-Autoren. Der Grund ist folgender:
Schade, dass Aaron Koblin keine Bücher über seine einzigartige Sicht auf Visualisierungen großer Datenmengen veröffentlicht hat.
Ich schätze nicht ein, wie nützlich die Arbeit von Tufte, Cleveland und Wilkinson ist, aber nachdem ich einige davon durchgearbeitet hatte und mit modernen Datenvisualisierungstools nur unwesentlich besser umgehen konnte, war Stephen Fews "Show me the Numbers" wie ein Lichtschalter.
quelle
Dies hängt stark von der Sprache ab, die Sie bevorzugen. Da ich Python nicht häufig für die Datenvisualisierung verwende, kann ich Ihnen nur Bücher zur Datenvisualisierung in R empfehlen. Nachdem ich diesen Beitrag geschrieben habe, lese ich Ihre Frage und Nr. 1, Nr. 2 und vielleicht Nr. 4 könnte die theoretischste sein. Obwohl Nr. 6 erklärt Ihnen auch theoretische Aspekte, die auf die Visualisierung unbeaufsichtigter Techniken des maschinellen Lernens spezialisiert sind.
Der Autor Paul Murrell ist maßgeblich an der Entwicklung der Grafiken der R-Sprache beteiligt. Er entwickelte das Konzept "Grammatik der Grafik", das der ggplot2-Bibliothek zugrunde liegt. Das Buch ist ziemlich fortgeschritten, obwohl Sie nicht viel Vorwissen brauchen, das notwendig und ziemlich theoretisch ist. Es ist das beste Buch für Leute, die die Konzepte der Datenvisualisierung in R wirklich verstehen wollen, aber ich empfehle es nicht für Anfänger.
Ist ein Muss für die interaktive Datenvisualisierung. Verschiedene JavaScript-Bibliotheken werden in R übersetzt und an R angepasst. Sie können die meisten Widgets in RShiny, Markdown (als HTML gerendert) oder in der Konsole einfügen. Meine Lieblings-HTML-Widgets sind
datierbar (geschrieben von Yuhui Xe von RStudio, der auch das Strick- und das Bookdown-Paket geschrieben hat. Erfolgreich für das Anzeigen von Tabellen))
Dieses Buch ist eher anfängerfreundlich. Die Beispiele sind hauptsächlich in ggplot2 dargestellt. Als ich anfing, fortgeschrittene Datenvisualisierungstechniken in RI zu lernen, verwendete ich hauptsächlich diese und die offizielle ggplot2-Website.
Ist der beste Ausgangspunkt, um ggplot2 zu lernen, aber es kann überwältigend erscheinen, wenn Sie nicht bereit sind, leidenschaftlich zu sein, und wenn Sie nicht viel Zeit haben. ggplot2 ist fantastisch, aber es kann eine steile Lernkurve haben, z. B. können Sie das "+" nicht am Anfang der Zeile schreiben. Alle theoretischen Konzepte werden ebenfalls erklärt.
Shiny ist die am häufigsten verwendete R-Bibliothek zum Erstellen von Apps mit R. Sie kann durch BI-Tools wie Tableau oder Qlickview ersetzt werden. shinyjs ist eine großartige Erweiterung von shiny, die glänzend mit Javascript kombiniert. Sie können jedoch auch HTML, CSS und JavaScript selbst einbinden .
Dieses Buch stammt von denselben Autoren wie der Leitfaden für schöne Grafiken (Nr . 3) . Es ist ein Fachbuch zur Visualisierung unbeaufsichtigter Techniken des maschinellen Lernens und insbesondere des Clustering.
7. Einfaches Tutorial
Für den Fall, dass Sie gerade anfangen zu visualisieren und ich Sie ein wenig überwältigt habe.
quelle
R for Data Science von Garret Grolemund und Hadley Wickham
Top 50 ggplot2-Visualisierungen
Die R Graph Galerie
r4stats.com
quelle