Ich versuche, die Standardabweichung intuitiver zu verstehen.
Soweit ich weiß, ist es repräsentativ für den Durchschnitt der Unterschiede eines Satzes von Beobachtungen in einem Datensatz gegenüber dem Mittelwert dieses Datensatzes. Es entspricht jedoch NICHT den Durchschnittswerten der Differenzen, da Beobachtungen, die weiter vom Mittelwert entfernt sind, mehr Gewicht erhalten.
Angenommen, ich habe die folgende Grundgesamtheit von Werten -
Der Mittelwert ist .
Wenn ich die Streuung auf der Grundlage des absoluten Werts beziehe, erhalte ich
Wenn ich ein Spread-Maß nehme, das auf der Standardabweichung basiert, erhalte ich
Das Ergebnis bei Verwendung der Standardabweichung ist erwartungsgemäß größer, da Werte, die weiter vom Mittelwert entfernt sind, zusätzlich gewichtet werden.
Aber wenn mir nur gesagt würde, dass ich es mit einer Bevölkerung mit einem Mittelwert von und einer Standardabweichung von tun habe, wie würde ich daraus schließen, dass die Bevölkerung aus Werten wie ? Es scheint nur, dass die Zahl sehr willkürlich ist ... Ich verstehe nicht, wie Sie es interpretieren sollen. Bedeutet dass die Werte sehr breit gestreut sind, oder sind sie alle eng um den Mittelwert gruppiert?2,83 { 1 , 3 , 5 , 7 , 9 } 2,83 2,83
Wenn Ihnen die Aussage vorgelegt wird, dass Sie es mit einer Bevölkerung mit einem Mittelwert von und einer Standardabweichung von tun haben, was sagt Ihnen das über die Bevölkerung aus?2,83
quelle
Antworten:
Meine Intuition ist, dass die Standardabweichung ist: ein Maß für die Verbreitung der Daten.
Sie haben ein gutes Argument dafür, dass es von unserer zugrunde liegenden Annahme für die Verteilung der Daten abhängt, ob sie breit oder eng ist.
Vorsichtsmaßnahme: Ein Maß für die Streuung ist am hilfreichsten, wenn die Verteilung Ihrer Daten symmetrisch zum Mittelwert ist und eine Varianz aufweist, die der Normalverteilung relativ nahe kommt. (Dies bedeutet, dass es ungefähr normal ist.)
In dem Fall, in dem die Daten ungefähr normal sind, hat die Standardabweichung eine kanonische Interpretation:
(siehe erste Grafik im Wiki )
Dies bedeutet, dass, wenn wir wissen, dass der Bevölkerungsmittelwert 5 und die Standardabweichung 2,83 beträgt und wir davon ausgehen, dass die Verteilung ungefähr normal ist, ich Ihnen sagen würde, dass ich ziemlich sicher bin, dass, wenn wir (sehr) viele Beobachtungen machen, nur 5% dies tun werden kleiner als 0,4 = 5 - 2 * 2,3 oder größer als 9,6 = 5 + 2 * 2,3 sein.
Beachten Sie, wie sich die Standardabweichung auf unser Konfidenzintervall auswirkt. (je breiter, desto unsicherer)
Darüber hinaus wissen Sie im allgemeinen Fall, dass die Daten nicht annähernd normal, aber immer noch symmetrisch sind, dass es einige für die:α
Sie können entweder aus einer Teilstichprobe lernen oder annehmen. Dies gibt Ihnen häufig eine gute Faustregel, um in Ihrem Kopf zu berechnen, welche zukünftigen Beobachtungen zu erwarten sind oder welche der neuen Beobachtungen als solche betrachtet werden können Ausreißer. (Beachten Sie jedoch die Einschränkung!)α = 2α α = 2
Ich denke, jede Frage, die "wide or tight" gestellt wird, sollte auch Folgendes enthalten: "in Bezug auf was?". Ein Vorschlag könnte sein, eine bekannte Distribution als Referenz zu verwenden. Abhängig vom Kontext kann es nützlich sein, über Folgendes nachzudenken: "Ist es viel breiter oder enger als ein Normal / Poisson?".
EDIT: Basierend auf einem nützlichen Hinweis in den Kommentaren ein weiterer Aspekt zur Standardabweichung als Abstandsmaß.
Eine weitere Intuition für die Nützlichkeit der Standardabweichung ist, dass es sich um ein Abstandsmaß zwischen den und ihrem Mittelwert :sN x1, … , XN x¯
Zum Vergleich wird der mittlere quadratische Fehler (MSE), eine der beliebtesten Fehlermaßnahmen in der Statistik, wie folgt definiert:
Die Fragen können aufgeworfen werden, warum die obige Distanzfunktion? Warum zum Beispiel quadratische Abstände und keine absoluten Abstände? Und warum ziehen wir die Quadratwurzel?
Quadratische Distanz- oder Fehlerfunktionen haben den Vorteil, dass wir sie sowohl unterscheiden als auch leicht minimieren können. Was die Quadratwurzel anbelangt, trägt dies zur Interpretierbarkeit bei, da der Fehler zurück in die Skala unserer beobachteten Daten konvertiert wird.
quelle
Es kann hilfreich sein zu erkennen, dass der Mittelwert dem Massenmittelpunkt entspricht . Die Varianz ist das Trägheitsmoment . Die Standardabweichung ist der Trägheitsradius .
Für eine historische Perspektive werfen Sie einen Blick auf:
George Airy (1875) Zur algebraischen und numerischen Theorie der Beobachtungsfehler und der Beobachtungskombination
Karl Pearson (1894) Beiträge zur mathematischen Evolutionstheorie.
Dieses Diagramm von Airy 1875 zeigt die verschiedenen Maße der Abweichung, die leicht ineinander umgewandelt werden können (Seite 17). Die Standardabweichung wird als "Fehler des mittleren Quadrats" bezeichnet. Es wird auch auf den Seiten 20-21 besprochen und seine Verwendung auf Seite 48 begründet. Dies zeigt, dass es am einfachsten ist, von Hand zu berechnen, da negative und positive Fehler nicht getrennt berechnet werden müssen. Der Begriff Standardabweichung wurde von Pearson in dem oben zitierten Aufsatz auf Seite 75 eingeführt.
Übrigens: Beachten Sie, dass die Nützlichkeit der Standardabweichung von der Anwendbarkeit des "Fehlergesetzes" abhängt, das auch als "normale Kurve" bezeichnet wird und sich aus "sehr vielen unabhängigen Fehlerursachen" ergibt (Airy 1875 S. 7). Es gibt keinen Grund zu der Annahme, dass Abweichungen von einem Gruppenmittelwert jedes Einzelnen diesem Gesetz folgen sollten. In vielen Fällen ist für biologische Systeme eine logarithmische Normalverteilung eine bessere Annahme als normal. Sehen:
Limpert et al. (2001) Logarithmische Normalverteilungen über die Wissenschaften: Schlüssel und Hinweise
Es ist weiterhin fraglich, ob es angebracht ist, individuelle Variationen als Rauschen zu behandeln, da der Datenerzeugungsprozess auf der Ebene des Individuums und nicht der Gruppe abläuft.
quelle
Die Standardabweichung gibt denjenigen, die weiter vom Mittelwert entfernt sind, tatsächlich mehr Gewicht, da sie die Quadratwurzel des Durchschnitts der quadratischen Abstände ist. Die Gründe für die Verwendung dieser Methode (anstelle der von Ihnen vorgeschlagenen mittleren absoluten Abweichung oder der in robusten Statistiken verwendeten mittleren absoluten Abweichung) liegen zum Teil darin, dass die Berechnung mit Polynomen einfacher ist als mit absoluten Werten. Oft möchten wir jedoch die Extremwerte hervorheben.
Ihre Frage nach der intuitiven Bedeutung entwickelt sich im Laufe der Zeit. Sie haben Recht, dass mehr als ein Satz von Zahlen den gleichen Mittelwert und den gleichen Wert haben kann. Dies liegt daran, dass der Mittelwert und SD nur zwei Informationen sind und der Datensatz 5 Teile (als 1,3,5,7,9) oder viel mehr umfassen kann.
Ob ein Mittelwert von 5 und sd von 2,83 "breit" oder "schmal" ist, hängt von dem Bereich ab, in dem Sie arbeiten.
Wenn Sie nur 5 Nummern haben, ist es einfach, sich die vollständige Liste anzusehen. Wenn Sie viele Zahlen haben, können Sie intuitiver über die Streuung nachdenken, z. B. über die Zusammenfassung der fünf Zahlen oder, noch besser, über Diagramme wie ein Dichtediagramm.
quelle
Die Standardabweichung misst den Abstand Ihrer Grundgesamtheit vom Mittelwert als Zufallsvariable.
Nehmen wir an, dass Ihre 5 Zahlen mit gleicher Wahrscheinlichkeit vorgekommen sind, sodass jede Wahrscheinlichkeit 0,20 hat. Dies wird durch die Zufallsvariable gegeben durchX: [ 0 , 1 ] → R
Der Grund, warum wir uns der Funktions- und Maßtheorie zuwenden, ist, dass wir systematisch darüber diskutieren müssen, wie zwei Wahrscheinlichkeitsräume bis zu Ereignissen mit einer Wahrscheinlichkeit von Null identisch sind. Nachdem wir zu Funktionen gewechselt sind, brauchen wir ein Gefühl der Distanz.
Es gibt viele Richtungen der Distanz für Funktionen, insbesondere die Normen für und induzieren die Distanzfunktionen .
Wenn wir die Norm wir die von Ihnen erwähnte naive Absolutwertabweichung: Wenn wir die Norm wir die übliche Standardabweichungp = 1
Hier bezeichnet die konstante Funktion .5- t ↦ 5
Die Bedeutung der Standardabweichung zu verstehen bedeutet, die Bedeutung der Abstandsfunktion verstehen und zu verstehen, warum sie in vielerlei Hinsicht das beste Maß für den Abstand zwischen Funktionen ist.d2
quelle