Wie bewerte ich die Standardabweichung?

15

Ich habe Antworten von 85 Personen zu ihrer Fähigkeit, bestimmte Aufgaben zu erledigen, gesammelt.

Die Antworten sind auf einer Fünf-Punkte-Likert-Skala:

5 = sehr gut, 4 = gut, 3 = durchschnittlich, 2 = schlecht, 1 = sehr schlecht,

Der Mittelwert liegt bei 2,8 und die Standardabweichung bei 0,54.

Ich verstehe, wofür der Mittelwert und die Standardabweichung stehen.

Meine Frage ist: Wie gut (oder schlecht) ist diese Standardabweichung?

Mit anderen Worten, gibt es Richtlinien, die bei der Bewertung der Standardabweichung hilfreich sein können.

Amarald
quelle
Was würde es für den SD bedeuten, hier gut oder schlecht zu sein?
gung - Reinstate Monica
7
Es ist ziemlich schwierig, eine so kleine SD mit solchen Daten zu erhalten: Für einen Mittelwert von 2,8 muss die SD mindestens . (Selbst wenn 2,8 einen gerundeten Wert darstellt, muss die SD 0,357 überschreiten.) Eine SD von 0,54 impliziert, dass nicht mehr als zwei Personen mit einer 5 (mit 21 2 und 62 3) hätten antworten können und nicht mehr als sechs hätten antworten können mit einer 1 (mit 5 2 und 74 3). Dies deutet darauf hin, dass die Frage möglicherweise außergewöhnlich wenig Informationen liefert, da die Skala nicht effektiv diskriminiert. 0,2×0,8=0,4
Whuber
@whuber ausgezeichnete Daten für Sensics! Aber ich könnte mir auch vorstellen, dass er entweder über verschiedene Fragen gemittelt hat oder etwas falsch in seinen Berechnungen gemacht hat. Es ist schwer vorstellbar, dass die Menschen wirklich so einheitlich reagierten, besonders wenn es um ihre vermeintlichen Fähigkeiten ging.
Erik

Antworten:

17

Standardabweichungen sind nicht "gut" oder "schlecht". Sie sind Indikatoren für die Verteilung Ihrer Daten. In Bewertungsskalen möchten wir manchmal eine breite Streuung, da dies darauf hinweist, dass unsere Fragen / Bewertungen den Bereich der Gruppe abdecken, die wir bewerten. Ein anderes Mal wollen wir eine kleine SD, weil wir wollen, dass alle "hoch" sind.

3+2

So. Was ist der Zweck Ihres Tests? Wer ist in der Stichprobe?

Peter Flom - Wiedereinsetzung von Monica
quelle
2
(+1) Nur um der Bemerkung ein wenig hinzuzufügen: "Standardabweichungen sind nicht 'gut' oder 'schlecht'" - ein Prädiktor mit großer Standardabweichung kann "gut" sein, weil er in der Regression umgekehrt zum Standard ist Fehler einer Regressionskoeffizientenschätzung. Wenn Sie sich dagegen mit der Genauigkeit einer Messung befassen, ist eine große Standardabweichung "schlecht". Ich vermute, dass das Interesse des ursprünglichen Posters näher am ersteren liegt, aber es ist nicht klar.
Makro
10

Kurze Antwort, es ist in Ordnung und ein bisschen niedriger als ich es von Umfragedaten erwartet hätte. Aber wahrscheinlich liegt Ihre Unternehmensgeschichte eher im Mittel oder unter den Top-2-Box-Prozenten.

Für diskrete Maßstäbe aus der sozialwissenschaftlichen Forschung ist die Standardabweichung in der Praxis eine direkte Funktion des Mittelwerts. Insbesondere habe ich durch empirische Analyse vieler solcher Studien herausgefunden, dass die tatsächliche Standardabweichung in Umfragen auf 5-Punkt-Skalen 40% -60% der maximal möglichen Abweichung beträgt (hier leider nicht dokumentiert).

Betrachten Sie auf der einfachsten Ebene die Extreme und stellen Sie sich vor, der Mittelwert sei 5,0. Die Standardabweichung muss Null sein, da der einzige Weg, um 5 zu mitteln, darin besteht, dass jeder auf 5 antwortet. Wenn umgekehrt der Mittelwert 1,0 wäre, muss der Standardfehler ebenfalls 0 sein. Die Standardabweichung ist also genau über den Mittelwert definiert.

Jetzt dazwischen gibt es mehr Grauzone. Stellen Sie sich vor, die Leute könnten entweder 5.0 oder 1.0 beantworten, aber nichts dazwischen. Dann ist die Standardabweichung eine genaue Funktion des Mittelwerts:

stdev = sqrt ((5-Mittelwert) * (Mittelwert-1))

Die maximale Standardabweichung für Antworten auf einer begrenzten Skala beträgt die Hälfte der Skalenbreite. Hier ist sqrt ((5-3) (3-1)) = sqrt (2 * 2) = 2.

Jetzt können die Leute natürlich Werte dazwischen beantworten. Aus den Metastudien der Umfragedaten in unserer Firma geht hervor, dass die Standardabweichung für numerische Skalen in der Praxis 40% -60% des Maximums beträgt. Speziell

  • 40% für 100% Punkteskalen,
  • 50% für 10-Punkte-Skalen und
  • 60% für 5-Punkt-Skalen und
  • 100% für binäre Skalen

Für Ihren Datensatz würde ich also eine Standardabweichung von 60% x 2,0 = 1,2 erwarten. Sie haben 0,54, das ist ungefähr die Hälfte dessen, was ich erwartet hätte, wenn die Ergebnisse selbsterklärende Bewertungen gewesen wären. Sind die Kompetenzbewertungen Ergebnisse von komplizierteren Testbatterien, die Durchschnittswerte sind und daher eine geringere Varianz aufweisen würden?

Die wahre Geschichte ist jedoch wahrscheinlich, dass die Fähigkeit im Vergleich zu anderen Aufgaben so niedrig oder so hoch ist. Geben Sie die Mittelwerte oder Top-2-Box-Prozentsätze zwischen den Fähigkeiten an und konzentrieren Sie Ihre Analyse darauf.

Prototyp
quelle
-1

Wenn die Daten normal verteilt sind, können Sie sehen, wie sich die Bevölkerung befindet.

  • 68% aller Personen liegen innerhalb einer Standardabweichung vom Mittelwert ( 2.26 - 3.34):

Bildbeschreibung hier eingeben

  • 95% aller Menschen liegen innerhalb von 2 Standardabweichungen des Mittelwerts ( 1.72 - 3.88):

Bildbeschreibung hier eingeben

Es zeigt Ihnen, wie "verteilt" Ihre Zahlen sind.

Ian Boyd
quelle
1
Diese Antwort wurde nicht positiv bewertet, da sie falsch ist: In einem Fall, in dem sie nicht anwendbar ist, wird eine ungefähre Faustregel verwendet (als ob sie genau wäre). Die Antwort wäre wahr, wenn sie durch die Schlussfolgerungen der Chebyshev-Ungleichung ersetzt würde (die besagt, dass mindestens 75% der Beobachtungen innerhalb von zwei SDs der mittleren Beobachtung liegen, dh mindestens 75% der Antworten sind 2er oder 3er), aber dies wird nicht viel Einsicht geben.
Whuber
Außerdem gilt dies nur für wirklich normalverteilte Bevölkerungsgruppen. Von dort aus können Sie die Zahlen beliebig genau berechnen, indem Sie das Integral über das normale PDF auswerten und dabei die vom SD um den Mittelwert angegebenen Grenzen einhalten. Wirklich nicht hilfreich hier.
Douba