(Dies ist wirklich ein Kommentar, aber da er eine Illustration erfordert, muss er als Antwort veröffentlicht werden.)
Ed Tufte hat das Boxplot in seiner visuellen Darstellung quantitativer Informationen (S. 125, Erstausgabe 1983) genau so umgestaltet , dass "eine informelle, explorative Datenanalyse möglich ist, bei der die Zeit des Forschers anderen Themen als dem Zeichnen von Linien gewidmet werden sollte". Ich habe sein Redesign (auf ganz natürliche Weise) erweitert, um in diesem Beispiel Ausreißer mit 70 parallelen Boxplots zu zeichnen:
Ich kann mir verschiedene Möglichkeiten vorstellen, um dies weiter zu verbessern, aber es ist charakteristisch für das, was man in der Hitze der Erkundung eines komplexen Datensatzes produzieren könnte: Wir geben uns damit zufrieden, Visualisierungen zu erstellen, mit denen wir die Daten sehen können; Eine gute Präsentation kann später kommen.
Vergleichen Sie dies mit einer herkömmlichen Wiedergabe derselben Daten:
Tufte präsentiert mehrere andere Neugestaltungen, die auf seinem Prinzip der "Maximierung des Datentintenverhältnisses" basieren. Ihr Wert liegt in der Veranschaulichung, wie dieses Prinzip uns helfen kann, effektive Erkundungsgrafiken zu entwerfen. Wie Sie sehen können, besteht die Mechanik des Zeichnens darin, eine Grafikplattform zu finden, auf der Sie Punktmarkierungen und Linien zeichnen können.
Bohnenplots
Möglicherweise die coolsten Handlungen aller Zeiten, dies sind im Grunde eine Implementierung von Geigen-Handlungen mit kleinen Vielfachen. Violin-Plots haben einen massiven Vorteil gegenüber Boxplots: Sie können für Verteilungen, die nicht normal sind, viel mehr Details zeigen (z. B. können sie bimodale Verteilungen sehr gut zeigen). Da sie normalerweise auf Gaußscher Glättung (oder ähnlichem) basieren, funktionieren sie für Verteilungen mit hohen Endpunkten (wie Exponentialverteilungen) nicht wirklich gut, aber Boxplots auch nicht.
Beanplots können in R sehr einfach erstellt werden - installieren Sie einfach das Beanplot- Paket:
Die
beanplot
Funktion verfügt über unzählige Optionen , sodass Sie sie nach Herzenslust anpassen können. Es gibt auch eine Möglichkeit, Beanplots in ggplot2 zu erstellen (benötigen die neueste Version):quelle
Hier ist ein Beispiel für einen R-Code, der einige Möglichkeiten bietet. Sie sollten diesen Code wahrscheinlich erweitern (einschließlich Beschriftungen usw.) und ihn möglicherweise in eine Funktion umwandeln:
quelle