Kontext:
Im Laufe der Zeit habe ich eine Reihe von Heuristiken zur effektiven Darstellung der Assoziation zwischen zwei numerischen Variablen entwickelt. Ich stelle mir vor, dass die meisten Leute, die mit Daten arbeiten, ähnliche Regeln haben würden.
Beispiele für solche Regeln könnten sein:
- Wenn eine der Variablen positiv verzerrt ist, können Sie diese Achse auf einer logarithmischen Skala darstellen.
- Wenn viele Datenpunkte vorhanden sind (z. B. n> 1000), wenden Sie eine andere Strategie an, z. B. die Verwendung einer Form von partieller Transparenz oder das Abtasten der Daten.
- Wenn eine der Variablen eine begrenzte Anzahl diskreter Kategorien annimmt, ziehen Sie die Verwendung eines Jitter- oder Sonnenblumenplots in Betracht.
- Wenn es drei oder mehr Variablen gibt, ziehen Sie die Verwendung einer Streudiagramm-Matrix in Betracht.
- Das Anpassen einer Form von Trendlinie ist oft nützlich.
- Passen Sie die Größe des Zeichnungszeichens an die Stichprobengröße an (verwenden Sie für ein größeres n ein kleineres Zeichnungszeichen).
- und so weiter.
Frage:
Ich möchte in der Lage sein, die Schüler auf eine Webseite oder Website zu verweisen, auf der diese und andere Tricks zum effektiven Zeichnen von Assoziationen zwischen zwei numerischen Variablen erläutert werden, möglicherweise mit Beispielen.
- Gibt es Seiten oder Sites im Internet, die dies gut machen?
data-visualization
correlation
teaching
rule-of-thumb
scatterplot
Jeromy Anglim
quelle
quelle
Antworten:
Ich kann mir keine großartigen Online-Ressourcen vorstellen, aber ein nettes (und leicht herunterladbares) Buchkapitel, das beschreibt, wie man einen großen, mehrdimensionalen Datensatz auf durchdachte Weise visuell erforscht, ist das von Brendan O'Connor und Lukas Biewald Kapitel (Warnung: Link ist direkt zu einem PDF) von Beautiful Data . Das Kapitel eignet sich besonders als Lehrmittel, da es R-Code in die Erzählung einbezieht.
Außerdem denke ich, dass John Tukeys Klassiker "Some Graphic and Semigraphic Displays" (der bequem auf der Website von Edward Tufte zu finden ist) eine wirklich wunderbare, wenn auch etwas eigenwillige Einführung in die Visualisierung darstellt.
Aus irgendeinem Grund denke ich an Buchkapitel ...
quelle
Aktuelle Referenzen:
Kelleher und Wagner 2011 "Zehn Richtlinien für eine effektive Datenvisualisierung in wissenschaftlichen Publikationen" bieten ein schönes Regelwerk. Die Regeln mit Verweisen (aber nicht dem vollständigen Artikel) sind ohne Abonnement erhältlich, obwohl Studenten wahrscheinlich vollen Zugriff haben würden.
"Making Data Meaningful" der Vereinten Nationen 2009 bietet einen schönen Überblick mit Regeln und Beispielen, einschließlich eines Abschnitts über "neue Technologien".
Ältere, aber relevante Ressourcen
SIGGGRAPH bietet einige exzellente Tutorials, auch wenn Beispiele fehlen, darunter:
Senay und Ignatius 1999 "Regeln und Prinzipien der wissenschaftlichen Datenvisualisierung"
Domik 1999 "Tutorial zur Visualisierung"
Eine gute Zusammenfassung von Tufte finden Sie hier:
quelle