Beim Plotten eines Boxplots mit Python Matplotblib sind die Linien auf halber Höhe des Plots der Median der Verteilung.
Gibt es eine Möglichkeit, stattdessen die Leitung im Durchschnitt zu haben. Oder um es daneben in einem anderen Stil zu zeichnen.
Wird es meine Leser wirklich verwirren, wenn ich den Durchschnitt nehme, weil die Linie der Median ist?
data-visualization
python
matplotlib
boxplot
Peter Smit
quelle
quelle
Zur Beantwortung Ihrer zweiten Frage: Ja, ich denke, es wird verwirrend sein, die Linie anstelle des Medians auf den Mittelwert zu setzen. Die genauen Regeln für die Länge der "Whisker" (falls vorhanden) und die Behandlung von Ausreißern variieren, aber jeder verwendet das Kästchen weiterhin als Anzeige des Medians sowie des unteren und oberen Quartils. Bei stark schräg gestellten Verteilungen könnte der Mittelwert außerhalb des Rahmens liegen, was sehr seltsam aussehen würde. Häufig wird verwendet, dass der Median zum Interquartilbereich gehört, während der Mittelwert zur Standardabweichung (oder zum Standardfehler des Mittelwerts, wenn Sie eher an Inferenz als an Datenbeschreibung interessiert sind) gehört. Wenn Sie den Mittelwert visuell darstellen möchten, würde ich ein anderes Symbol verwenden, um ihn anzuzeigen, um Verwirrung zu vermeiden.
quelle