Ich habe ein Jahr (365 Tage) täglich Stickstoffdioxidmessungen und das Interquartil (IQR) beträgt 24 Mikrogramm pro Kubikmeter. Was bedeutet "24" in diesem Zusammenhang, abgesehen von der Definition von IQR, die den Unterschied zwischen dem 25. und 75. Perzentil darstellt ? Wie würden Sie diese Zahl beispielsweise einem Journalisten erklären?
Vielen Dank
descriptive-statistics
user2742
quelle
quelle
Antworten:
Aus der Definition definiert dies den Bereich, der 75-25 = 50 Prozent aller gemessenen Werte hält.
: (Median-24/2, Median + 24/2). Der Median sollte irgendwo in der Nähe dieses IQR geschrieben werden.Das obige war natürlich falsch, es scheint, dass ich beim Schreiben noch geschlafen habe; Entschuldigen Sie das Durcheinander. Es ist wahr, dass IQR die Breite eines Bereichs ist, der 50% der Daten enthält, aber nicht im Median zentriert ist - man muss sowohl Q1 als auch Q3 kennen, um diesen Bereich zu lokalisieren.
Im Allgemeinen kann IQR als nichtparametrisch (= wenn wir nicht annehmen, dass die Verteilung Gauß'sch ist) äquivalent zur Standardabweichung angesehen werden - beide messen die Streuung der Daten. (Äquivalent ungleich für SD (Mittelwert- , Mittelwert + ) enthält 68,2% der perfekt normalverteilten Daten).σσ σ
BEARBEITEN: So sieht es beispielsweise bei normalen Daten aus. rote Linien zeigen , der Bereich, der durch das Kästchen auf dem Kästchenplot angezeigt wird, zeigt IQR, das Histogramm zeigt die Daten selbst: Sie können sehen, dass beide ziemlich gut verteilt sind; Bereich enthält (wie erwartet) 68,3% der Daten. Bei nicht normalen Daten wird der SD-Spread aufgrund des langen, asymmetrischen Schwanzes erweitert und enthält 90,5% der Daten! (IQR hält per Definition in beiden Fällen 50%)± 1 σ ± 1 σ±1σ
±1σ
±1σ
quelle
Dies ist eine einfache Frage, die nach einer einfachen Antwort fragt. Hier ist eine Liste von Aussagen, die mit den grundlegendsten beginnen und mit genaueren Qualifikationen fortfahren.
quelle
Der Interquartilbereich ist ein Intervall , kein Skalar. Sie sollten immer beide Zahlen angeben, nicht nur den Unterschied zwischen ihnen. Sie können es dann erklären, indem Sie sagen, dass die Hälfte der Stichprobenwerte zwischen diesen beiden Werten lag, ein Viertel kleiner als das untere Quartil und ein Viertel höher als das obere Quartil.
quelle
Grob gesagt würde ich einem Journalisten sagen, dass ich den täglichen Stickstoffdioxidgehalt als sicher erklären könnte, nachdem ich die höchsten und niedrigsten Werte verworfen habe, dass an jedem der halben Tage in diesem Jahr der beobachtete Wert ist nicht über eine Entfernung von IQR / 2 vom angegebenen Niveau hinaus.
Wenn Ihr erstes und drittes Quartil beispielsweise 100 und 124 sind, können Sie sagen, dass das tägliche Niveau 112 (Durchschnitt von 100 und 124) beträgt, und Ihrem Gesprächspartner versichern, dass der Fehler, den Sie machen, in der Hälfte der Tage nicht größer als 12 ist .
quelle