Wie interpretiere ich ein Boxplot?

8

Ich habe einige Daten, in denen es 5 kategoriale erklärende Variablen ( concern, breath, weath, sleep, act) und 1 kontinuierliche Antwortvariable ( tto) gibt. Darüber hinaus ist jede kategoriale erklärende Variable in 5 Ebenen unterteilt, die zeigen, wie stark sich eine Person dabei fühlt. Level 1 und Level 5 zeigen den perfekten bzw. den schlechtesten Zustand.

Es wurde mir empfohlen, ein Box-Diagramm zu erstellen, um die Beziehung zwischen den erklärenden Variablen und der Antwortvariablen zu sehen. Die Darstellung ist unten angegeben. Ich weiß jedoch nicht, wie man einen Boxplot liest. Kann mir bitte jemand helfen, es zu interpretieren?

Geben Sie hier die Bildbeschreibung ein

Günal
quelle
2
Sie haben wahrscheinlich den Wikipedia-Artikel gelesen: en.wikipedia.org/wiki/Boxplot Können Sie klarer erklären, was Sie nicht verstehen?
Stephan Kolassa
Ja, habe ich. Ich kenne also das Grundpersonal. Ich weiß jedoch nicht, wie ich sie dazu verwenden soll. Ich meine, hier gibt es viele Grundstücke und ich muss die wichtigen Figuren auswählen. Beispielsweise sind in jeder der oben genannten Kategorien die Diagramme der Stufe 5 am längsten. Was bedeutet das? Welche Auswirkung hat es auf tto? Ein anderes Beispiel wäre, warum gibt es viele Punkte? Ich weiß, dass sie die Ausreißer darstellen, aber ich weiß nicht, wie ich das erweitern soll
Günal
2
Eine verwandte Frage, die die Einschränkungen dessen abdeckt, was Sie aus einem Box-Plot interpretieren können: Haben zwei Verteilungen mit identischen 5-Zahlen-Zusammenfassungen immer die gleiche Form?
Silverfish

Antworten:

10

Die Interpretation des Box-Plots (alternativ Box- und Whisker-Plot) beruht auf dem Verständnis, dass es eine grafische Darstellung einer Zusammenfassung mit fünf Zahlen bietet, dh Minimum, 1. Quartil, Median, 3. Quartil und Maximum. Die Box umfasst 50% der Beobachtungen. Die Enden der Whisker (vertikale Linien, die vom oberen und unteren Rand des Kastens ausgehen) zeigen normalerweise, wo das Minimum und das Maximum liegen. Wo jedoch mögliche Ausreißer existieren (manchmal basierend auf dem 1,5- Interquartilbereich bewertet ), werden Punkte hinzugefügt, wie dies für Ihre Figur der Fall ist.×

Es kann hilfreich sein, sich ein Histogramm oder Dichtediagramme für bestimmte Kategorien der Daten anzusehen, da dies Ihnen helfen kann, zu verstehen, was das Box-Diagramm sagt.

@Glen_b zeigt zu Recht an, dass der linke Versatz offensichtlich ist und die zentrale Tendenz für die 5. Stufe der Gefühlsstärke geringer ist als bei den anderen. Es ist jedoch schwierig zu erkennen, ob dieser Unterschied statistisch signifikant wäre oder nicht.

T-Student
quelle
8

Hier ist eine grundlegende Zusammenfassung dessen, was da ist:

  1. Alle Verteilungen erscheinen nach links geneigt, "verklemmt" gegen die Obergrenze von 1,0, wobei viele niedrige "Ausreißer" nach unten abfallen.
  2. Die 5. Kategorie in jeder Handlung scheint niedriger zu sein als die anderen. Manchmal ist auch die 4. Kategorie niedrig.
  3. Alle 5 Variablen (Sorge, Atem, Wetter, Schlaf, Handlung) scheinen weitgehend ähnliche Muster zu haben.
Glen_b -Reinstate Monica
quelle