Interpretation der Geigenhandlungen

9

Ich vergleiche die Verteilung verschiedener Gruppen anhand der Geigen-Diagramme. Die meisten Online-Ressourcen, die ich gefunden habe, beziehen sich jedoch nur auf die Erstellung der Diagramme und die sehr grundlegende Interpretation der Ergebnisse (die mittlere Variation, die Daten sind gruppiert oder nicht).

Ich suche nach detaillierten Beispielen, denen ich als Richtlinie zur korrekten Interpretation der Geigenpläne folgen kann.

Gago-Silva
quelle

Antworten:

9

Ein Geigenplot ist nur ein Histogramm (oder häufiger eine geglättete Variante wie eine Kerndichte), das auf die Seite gedreht und gespiegelt wird. Jedes Lehrbuch, in dem Sie lernen, wie man Histogramme interpretiert, sollte Ihnen die Intuition vermitteln, die Sie suchen. Bearbeiten gemäß dem Vorschlag von Nick Cox: Freedman, Pisani, Purves, Statistics deckt Histogramme ab.

Bei der formaleren Interpretation geht es bei der grafischen Darstellung der Verteilung vor allem darum, Dinge zu erkennen, durch die statistische Tests getäuscht werden könnten.

Eine Sache, die ich gerne mit Geigenplots mache, ist das Hinzufügen von Linien für den Median, den Mittelwert usw. Manchmal überlagere ich einen Boxplot, damit ich noch mehr zusammenfassende Statistiken sehen kann.

Zumindest sollten Sie in den ersten Augenblicken in der Lage sein, grobe Abweichungen (Mittelwert, Streuung, Schiefe, Kurtosis) sowie Bimodalität und Ausreißer zu erkennen.

Ari B. Friedman
quelle
2
+1, ein ähnliches Diagramm ist eine Bevölkerungspyramide , die reflektierte Verteilung ist nur eine andere Kategorie (und es werden eher typische Histogramm-Typ-Schätzer anstelle von kde verwendet).
Andy W
1
Weder Tukey, Exploratory Data Analysis , noch Cleveland, Elements of Graphing Data , sagen viel über Histogramme aus: Beide sind mehr an anderen Darstellungen interessiert und beeindruckter. Sind das die Bücher, auf die hier angespielt wird? Ein Buch, das Histogramme als grundlegend behandelt, ist Freedman, Pisani, Purves, Statistics .
Nick Cox
1
Eigentlich Cleveland nicht sagen etwas über Histogramme. Er sagt, dass es sich um schlechte Grafiken handelt und dass sie in seinem Buch nicht verwendet werden. :-). Und F, P und P ist ein wunderbares Buch.
Peter Flom - Monica wieder einsetzen
1
Ich habe von FPP unterrichtet. Sie würden OLS nicht explizit verwenden, um die Fläche eines Rechtecks ​​vorherzusagen, da sie keine explizite multivariate Regression durchführen. Sie haben jedoch einige Beispiele in diesem Sinne. Was wäre zum Beispiel, wenn Galileo versucht hätte, die Zeit t vorherzusagen, die ein Objekt benötigt, um durch lineare Regression aus der Höhe h zu fallen? Sie erhalten eine schöne Anpassung der kleinsten Quadrate, aber die Wahrheit ist natürlich - die Moral der Geschichte ist es, immer die Residuen zu betrachten. t=ch
Michael Lugo
1
@ TrevorAlexander Das ist eine gute Frage. Mir ist keine Literatur bekannt, die zeigt, dass Interpretation besser ist, wenn sie gespiegelt wird, aber sie sehen zumindest für mich besser aus als Histogramme in vertikaler Ausrichtung.
Ari B. Friedman