Die Studie, die ich überprüfe, berichtet über eine mittlere Körpergröße von 20 Probanden von 1,70 Metern mit einer Standardabweichung von 0,0. Bedeutet das, dass alle 20 genau 1,70 Meter sind? Oder ist dies ein Meldefehler?
Die Studie, die ich überprüfe, berichtet über eine mittlere Körpergröße von 20 Probanden von 1,70 Metern mit einer Standardabweichung von 0,0. Bedeutet das, dass alle 20 genau 1,70 Meter sind? Oder ist dies ein Meldefehler?
Gemäß diesem Biologie-SE-Faden beträgt die Standardabweichung der männlichen Erwachsenengröße etwa Meter und der weiblichen etwa Meter.0,06
Eine Rundung auf eine Dezimalstelle würde Meter ergeben. Die Tatsache, dass die Standardabweichung als Meter angegeben wird, zeigt eine Standardabweichung unter Metern an ... aber eine Standardabweichung von beispielsweise Metern würde immer noch mit der angegebenen Zahl übereinstimmen, da sie auf runden würde, jedoch a anzeigen würde Höhenunterschiede in der Stichprobe sind nur geringfügig geringer als die täglich in der Allgemeinbevölkerung beobachteten Schwankungen.0,0 0,05 0,048 0,0
Ist die Zahl gut berichtet? Nun, es wäre weitaus nützlicher, wenn die Standardabweichung als Mittelwert auf zwei Dezimalstellen angegeben worden wäre. Es kann sich auch um einen einfachen numerischen oder Rundungsfehler handeln. zum Beispiel haben könnte abgeschnitten auf anstatt abgerundet . Aber könnte es möglich sein, dass sich die Abbildung stattdessen auf den Standardfehler bezieht? Ich sehe oft Zahlen, die so geschrieben sind, dass es nicht eindeutig ist, ob eine Standardabweichung oder ein Standardfehler angegeben wird - zum Beispiel "der Stichprobenmittelwert ist ".0,0 1,62 ( ± 0,06 )
Wie plausibel ist es, wenn die richtige Standardabweichung auf auf eine Dezimalstelle gerundet wird ? Der folgende R-Code simuliert eine Million Stichproben der Größe 20 aus einer Population mit einer Standardabweichung von (wie an anderer Stelle für die weibliche Größe angegeben), ermittelt die Standardabweichung für jede Stichprobe, zeichnet ein Histogramm der Ergebnisse auf und berechnet den Anteil von Proben, bei denen die beobachtete Standardabweichung unter :0,06 0,05
set.seed(123) #so uses same random numbers each time code is run
x <- replicate(1e6, sd(rnorm(20, sd=0.06)))
hist(x)
sum(x < 0.05)/1e6
[1] 0.170691
Daher ist eine Standardabweichung, die auf rundet, nicht unplausibel und tritt in etwa siebzehn Prozent der Fälle auf, wenn die Höhen normalerweise mit der tatsächlichen Standardabweichung .0,06
Vorbehaltlich dieser Annahmen können wir diese Wahrscheinlichkeit auch wie folgt mit ungefähr siebzehn Prozent berechnen, anstatt sie zu simulieren:
wo wir die Tatsache verwendet haben, dass der Chi-Quadrat-Verteilung mit Grad folgt der Freiheit. Sie können die Wahrscheinlichkeit in R mit berechnen ; Wenn Sie durch veröffentlichten Zahlen für männliche Standardabweichungen ersetzen , verringert sich die Wahrscheinlichkeit auf etwa vier Prozent. Wie @whuber in den Kommentaren unten ausführt, ist es wahrscheinlicher, dass diese Art von kleinen "Runden auf Null" SD auftritt, wenn die Stichprobe homogener war als die allgemeine Bevölkerung. Wenn die Populationsstandardabweichung etwa beträgt n - 1 = 19 0,06 0,07 0,06pchisq(q = 19*0.05^2/0.06^2, df = 19)
Meter, dann wäre die Wahrscheinlichkeit, eine so kleine Standardabweichung der Stichprobe zu erhalten, ebenfalls gesunken, wenn die Stichprobengröße größer gewesen wäre.
curve(pchisq(q = 19*0.05^2/x^2, df = 19), from=0.005, to=0.1,
xlab="Population SD", ylab="Probability sample SD < 0.05 if n = 20")
curve(pchisq(q = (x-1)*0.05^2/0.06^2, df = x-1), from=2, to=50, ylim=c(0,0.6),
xlab="Sample size", ylab="Probability sample SD < 0.05 if population SD = 0.06")
pchisq(q = 19*0.005^2/0.01^2, df = 19)
ergibt sich nur eine Wahrscheinlichkeit von 0,04% für eine Probe SD <0,005. Selbst die Population SD = 0,008 ergibt eine Wahrscheinlichkeit von nur etwa 0,8%. Aber Populations-SDs von 0,007, 0,006 und 0,005 ergeben Wahrscheinlichkeiten von 4%, 17% (kein Zufall!) Und 54%Es handelt sich mit ziemlicher Sicherheit um einen Meldefehler, es sei denn, die Personen wurden für diese Größe ausgewählt.
quelle