Kann eine Standardabweichung der Rohwerte als Standardabweichung der Prozentsätze angegeben werden?

Angenommen, wir haben einen Test, der aus 30 Fragen besteht, und 10 Personen machen diesen Test. Die mittlere Testnote dieser 10 Personen beträgt 17, und die Standardabweichung aller Punktzahlen in der Stichprobe beträgt 4. Wenn wir die deskriptiven Statistiken in der Schule melden, verwenden wir diese Rohpunktzahlen und schreiben ( M = 17, SD = 4); In einigen Fällen habe ich jedoch das Gefühl, dass die Berichterstattung über Prozentsätze besser wäre. Weil ich denke, dass wir ein intuitiveres Verständnis dafür haben, was es bedeutet, 56,7 über 100 zu erzielen, als 17 über 30 zu erzielen (wahrscheinlich, weil wir an das Dezimalsystem gewöhnt sind).

Wäre es für das oben angegebene Beispiel möglich, den Mittelwert und die Standardabweichung als ( M = 56,7%, SD = 13,3%) anzugeben?

Ist es sinnvoll zu sagen, dass die Prüfungsergebnisse in einer Stichprobe die Standardabweichung von 13,3% haben?

Diese Prozentsätze sind das arithmetische Äquivalent der Rohwerte, die ich oben erstellt und angegeben habe, aber ich bin nicht sicher, ob es eine gute Praxis ist, sie direkt in solche Prozentsätze umzuwandeln.

mean standard-deviation percentage Freya
quelle

AFAIK Sie können kontinuierliche Variablen in eine andere Skala umwandeln und die Verteilung auf dieser Skala anzeigen, solange Sie wissen, wie Sie dorthin gekommen sind. In Ihrem Fall können Sie sich jedoch fragen, ob die aus 30 Fragen erzielte Rohbewertung genügend Informationen bietet, um sie in eine kontinuierliche Skala von 0 bis 100 (%) umzuwandeln (da die Daten nur Inkremente von 3,33% unterstützen).

IWS

Ja das stimmt. Eine Punktzahl über 30 ist nicht so informativ wie die konvertierte Punktzahl (über 100), da die Inkremente von 100 kleiner sind (1) und daher ein Test über 100 Punkte "empfindlicher" wäre, vorausgesetzt, alle Noten sind ganze Zahlen. Angesichts Ihrer Antwort denke ich jedoch, dass es in meinem Fall nicht als "Fehlverhalten" angesehen wird, sie auf diese Weise zu melden. (Ich bereite gerade eine Aufgabe für die Schule vor und werde den rohen Mittelwert und die SD im Text angeben, aber ich glaube nur, dass es sinnvoller ist, diese Ergebnisse als Prozentsätze in den Tabellen und Grafiken anzuzeigen.) Soweit ich weiß, wäre dies machbar.

Freya

Nur um vollständig zu sein: Beachten Sie, dass einige Transformationen möglicherweise tatsächlich die Form der Verteilung ändern. Sie sollten daher die Transformation, die Sie auf Ihre Daten anwenden möchten, nicht direkt auf Ihren Messort und Ihre Verteilung anwenden. Wenden Sie stattdessen die Transformation auf Ihre Daten an und bewerten Sie dann die Standort- und Ausbreitungsmaße, als ob dies die Originaldaten wären (dh definieren Sie den Mittelwert und die SD in Ihrem Fall neu).

IWS

Technisch gesehen wäre die SD als Maß für die Entfernung und nicht für den Standort eher Prozentpunkte (pp) als Prozent. Ich wäre auch vorsichtig, wenn ich es in diesem Zusammenhang interpretieren würde, da das Fehlermodell berücksichtigen sollte, dass die Skala diskret ist, wie @freya erwähnt.

James

Antworten:

Die Standardabweichung ist nur eine statistische Eigenschaft, die Sie für eine Reihe von Datenpunkten messen können. Die Standardabweichung selbst geht nicht davon aus, dass Ihre Daten normal verteilt sind oder keine linearen oder sonstigen Transformationen durchlaufen haben.

Daher ist es durchaus akzeptabel, die Standardabweichung für alle Daten zu verwenden, einschließlich der Prozentwerte.

Beachten Sie, dass in Ihrem speziellen Fall die Transformation, die Sie anwenden, eine lineare Transformation der folgenden Form ist:

y = A x + b

$y = Ax + b$

dh eine affine Transformation. Sie können also die Standardabweichung für die ursprünglichen, nicht transformierten Daten berechnen und dann mit multiplizieren A, um die Standardabweichung nach der Transformation zu erhalten. Dies scheint keinen besonderen Vorteil zu haben, als lediglich die Standardabweichung der bereits transformierten Daten zu berechnen, aber es könnte beruhigend sein.

Wir können sehen, dass eine affine Transformation die Standardabweichung wie folgt linear um transformiert : $A$

Vorausgesetzt, wir haben Eingabedaten , wird die ursprüngliche Standardabweichung gegeben durch: $\{X_1, X_2, ..., X_n\}$ $\sigma$

σ_{X}^{2} = \frac{1}{n} \sum_{i = 1}^{n} {(X_{i} - \frac{1}{n} \sum_{j = 1}^{n} X_{j})}^{2}

$\sigma_X^2 = \frac{1}{n}\sum_{i=1}^n \left(X_i - \frac{1}{n}\sum_{j=1}^n X_j\right)^2$

Wenden wir die Transformation . Dann haben wir $Y = AX + b$

σ_{Y}^{2} = \frac{1}{n} \sum_{i = 1}^{n} {(A X_{i} + b - \frac{1}{n} \sum_{j = 1}^{n} (A X_{j} + b))}^{2}

$\sigma_Y^2 = \frac{1}{n}\sum_{i=1}^n \left( AX_i + b - \frac{1}{n} \sum_{j=1}^n \left( AX_j + b \right) \right)^2$

= \frac{1}{n} \sum_{i = 1}^{n} {(A X_{i} + b - n \frac{1}{n} b - \frac{1}{n} \sum_{j = 1}^{n} (A X_{j}))}^{2}

$= \frac{1}{n}\sum_{i=1}^n \left( AX_i + b - n\frac{1}{n}b - \frac{1}{n} \sum_{j=1}^n \left( AX_j \right) \right)^2$

= \frac{1}{n} \sum_{i = 1}^{n} {(A X_{i} - \frac{1}{n} \sum_{j = 1}^{n} (A X_{j}))}^{2}

$= \frac{1}{n}\sum_{i=1}^n \left( AX_i - \frac{1}{n} \sum_{j=1}^n \left( AX_j \right) \right)^2$

= A^{2} (\frac{1}{n} \sum_{i = 1}^{n} {(X_{i} - \frac{1}{n} \sum_{j = 1}^{n} (X_{j}))}^{2})

$= A^2 \left( \frac{1}{n}\sum_{i=1}^n \left( X_i - \frac{1}{n} \sum_{j=1}^n \left( X_j \right) \right)^2 \right)$

= A^{2} σ_{X}^{2}

$= A^2 \sigma_X^2$

Deshalb

σ_{Y} = A σ_{X} .

$\sigma_Y = A \sigma_X.$

Hugh Perkins
quelle

Das ist eigentlich sehr hilfreich und aufschlussreich. Vielen Dank.

Freya