Ich frage mich, ob die Standardabweichung immer unter der Annahme einer Normalverteilung erstellt wurde. Mit anderen Worten, wenn die Stichprobe nicht normal verteilt ist, sollte die Verwendung der Standardabweichung dann als Fehler angesehen werden?
9
Antworten:
Nein. Die Verwendung der Standardabweichung setzt keine Normalität voraus.
Die Varianz einer Zufallsvariablen ist definiert als . Solange die Varianz existiert, existiert auch die Standardabweichung. Die Standardabweichung ist die Quadratwurzel der Varianz.Var(X)=E[(X−E[X])2]
Sie können die Varianz oder die Standardabweichung jederzeit verwenden, wenn beide vorhanden sind. Die Varianz tritt in unzähligen Situationen auf.Var(X)
Es gibt spezielle Theoreme, Lemmas usw., obwohl für den speziellen Fall, in dem der Normalverteilung folgt.X
Eine häufige Verwendung der Standardabweichung, die von der Normalität abhängt:
Wenn der Normalverteilung folgt, besteht eine Wahrscheinlichkeit von ungefähr 95%, dass innerhalb von zwei Standardabweichungen vom Mittelwert liegt.X X
Diese Aussage ist wahr, wenn der Normalverteilung (und mehreren anderen) folgt, aber im Allgemeinen nicht wahr.X
Eine häufige Verwendung der Varianz, die nicht von der Normalität abhängt:
Sei eine Zufallsvariable mit dem Mittelwert und der Varianz . Definieren Sie für als unabhängige Zufallsvariablen, die jeweils der identischen Verteilung wie folgen .X E[X]=μ Var(X)=σ2 Xi i=1,…,n X
Definieren Sie den Stichprobenmittelwert basierend auf Beobachtungen als:n
Nach dem zentralen Grenzwertsatz konvergiert gegen eine normalverteilte Zufallsvariable mit dem Mittelwert und der Varianz . (Genauer gesagt konvergiert in der Verteilung zu als .)X¯n μ σ2n n−−√(X¯n−μ) N(0,σ2) n→∞
Die praktische Implikation ist, dass der Stichprobenmittelwert für großes als normalverteilte Zufallsvariable behandelt werden kann, deren Varianz eine Funktion der Varianz von . (Recall ) Für dieses Ergebnis muss nicht normal sein. (Es erfordert ein niedrigeres , um gut zu funktionieren, wenn in gewissem Sinne näher an der Normalverteilung liegt.)X¯n n σ2n X Var(X)=σ2 X n X
Der zentrale Grenzwertsatz ist ein allgegenwärtiges Tool, das die Varianz verwendet und nicht braucht die Normalverteilung zu folgen.X X
quelle
In der Standard-IID-Einstellung ist (sowie ) unter geeigneten Regelmäßigkeitsbedingungen ein stark konsistenter Schätzer für . Dies folgt direkt aus dem starken Gesetz der großen Zahlen. Eine normale Modellannahme ist nicht erforderlich.S2 σ^2ML Var[Xi]
quelle