Gute Online-Ressource mit Tipps zur grafischen Zuordnung zwischen zwei numerischen Variablen unter verschiedenen Bedingungen

22

Kontext:

Im Laufe der Zeit habe ich eine Reihe von Heuristiken zur effektiven Darstellung der Assoziation zwischen zwei numerischen Variablen entwickelt. Ich stelle mir vor, dass die meisten Leute, die mit Daten arbeiten, ähnliche Regeln haben würden.

Beispiele für solche Regeln könnten sein:

  • Wenn eine der Variablen positiv verzerrt ist, können Sie diese Achse auf einer logarithmischen Skala darstellen.
  • Wenn viele Datenpunkte vorhanden sind (z. B. n> 1000), wenden Sie eine andere Strategie an, z. B. die Verwendung einer Form von partieller Transparenz oder das Abtasten der Daten.
  • Wenn eine der Variablen eine begrenzte Anzahl diskreter Kategorien annimmt, ziehen Sie die Verwendung eines Jitter- oder Sonnenblumenplots in Betracht.
  • Wenn es drei oder mehr Variablen gibt, ziehen Sie die Verwendung einer Streudiagramm-Matrix in Betracht.
  • Das Anpassen einer Form von Trendlinie ist oft nützlich.
  • Passen Sie die Größe des Zeichnungszeichens an die Stichprobengröße an (verwenden Sie für ein größeres n ein kleineres Zeichnungszeichen).
  • und so weiter.

Frage:

Ich möchte in der Lage sein, die Schüler auf eine Webseite oder Website zu verweisen, auf der diese und andere Tricks zum effektiven Zeichnen von Assoziationen zwischen zwei numerischen Variablen erläutert werden, möglicherweise mit Beispielen.

  • Gibt es Seiten oder Sites im Internet, die dies gut machen?
Jeromy Anglim
quelle
2
Wenn Sie es finden, ist das gedruckte "Graphics" -Handbuch, das mit älteren Kopien von Systat geliefert wurde (Pre-Windows, ob Sie es glauben oder nicht), eine ausgezeichnete Ressource. Es illustrierte nicht nur all diese Regeln (wie ich mich erinnere), es war auch voll von kernigen und ausgezeichneten Ratschlägen.
Whuber
2
@whuber, ein toller Kommentar. Leland Wilkinson, der Hauptautor von Systat und auch der Autor von The Grammar of Graphics (das eher ein Informatikbuch als ein Statistikbuch ist), hat einen sehr guten Geschmack für die grafische Darstellung von Daten. Seine Präsentationen sind immer sehr effektiv bei der Übermittlung ihrer Botschaften.
StasK
@ Jeromy, du kennst vielleicht schon das ggplot2- Paket für R, aber jetzt, wo die Grammatik der Grafiken erwähnt wurde, dachte ich, es auch zu erwähnen. Ich finde das Paket, das Buch und das Online- Referenzhandbuch von Hadley Wickham sehr nützlich, um numerische Variablen in nützliche Diagramme und Grafiken umzuwandeln.
NRH
1
@Jeromy, warum nicht die Frage (separat) als Community-Wiki umformulieren und einen Beitrag pro Regel anfordern? Auf diese Weise könnten wir anstelle einer Reihe von Links eine Reihe von abstimmbaren Regeln haben und die Ressource hier erstellen.
David LeBauer
@ David Okay, ich habe eine allgemeine Community-Wiki-Frage zu den besten Ressourcen für das Entwerfen von Plots hinzugefügt. Stats.stackexchange.com/questions/16631/…
Jeromy Anglim

Antworten:

13

Ich kann mir keine großartigen Online-Ressourcen vorstellen, aber ein nettes (und leicht herunterladbares) Buchkapitel, das beschreibt, wie man einen großen, mehrdimensionalen Datensatz auf durchdachte Weise visuell erforscht, ist das von Brendan O'Connor und Lukas Biewald Kapitel (Warnung: Link ist direkt zu einem PDF) von Beautiful Data . Das Kapitel eignet sich besonders als Lehrmittel, da es R-Code in die Erzählung einbezieht.

Außerdem denke ich, dass John Tukeys Klassiker "Some Graphic and Semigraphic Displays" (der bequem auf der Website von Edward Tufte zu finden ist) eine wirklich wunderbare, wenn auch etwas eigenwillige Einführung in die Visualisierung darstellt.

Aus irgendeinem Grund denke ich an Buchkapitel ...

ashaw
quelle
+1 Zumindest diese Kapitel sind im Web verfügbar: Ich denke, das ist ausreichend. Danke, Aaron.
whuber
@ whuber danke für das Posten des Kopfgeldes; und @ashaw sorgen beide Links für eine interessante Lektüre.
Jeromy Anglim
Ich stelle fest, dass der Tukey-Artikel ein Vorgänger der erweiterten Behandlung in seinem Buch EDA (1977) ist (mit Ausnahme des letzten Abschnitts zum Aufhängen von Wurzeln und Histogrammen).
Whuber
11

Aktuelle Referenzen:

Ältere, aber relevante Ressourcen

David LeBauer
quelle
3
+1 Die Regeln und Tutorials sehen nützlich, umfassend und abweisend aus! Wie ist es möglich, über Grafiken zu schreiben, ohne eine einzige Illustration bereitzustellen ? :-)
whuber
1
Die Wahl fiel mir schwer, aber ich habe dieser Antwort das Kopfgeld zuerkannt, weil sie die gestellte Frage insgesamt am besten beantwortet. Das UN-Dokument mit seiner einfachen Sprache und vielen klaren Beispielen scheint besonders nützlich und für Studenten zugänglich zu sein.
Whuber