Entschuldigung, wenn dies an anderer Stelle beantwortet wurde, ich konnte es nicht finden.
Ich frage mich, warum wir die Quadratwurzel insbesondere der Varianz nehmen, um die Standardabweichung zu erzeugen. Was bedeutet es, die Quadratwurzel zu ziehen, die einen nützlichen Wert ergibt?
Antworten:
In gewissem Sinne ist dies eine triviale Frage, in einem anderen Sinne ist sie tatsächlich ziemlich tief!
Wie andere bereits erwähnt haben, impliziert die Verwendung der Quadratwurzel, dass die gleichen Einheiten wie .Stdev(X) X
Wenn Sie die Quadratwurzel ziehen, erhalten Sie absolute Homogenität, auch absolute Skalierbarkeit genannt . Für jeden skalar und Zufallsvariable , die wir haben: Absolute Homogenität ist eine erforderliche Eigenschaft einer Norm . Die Standardabweichung kann als Norm (auf dem Vektorraum der Zufallsvariablen mit dem Mittelwert Null) auf ähnliche Weise interpretiert werden wie die euklidische Standardnorm in einer dreidimensionalen Platz. Die Standardabweichung ist ein Maß für den Abstand zwischen einer Zufallsvariablen und ihrem Mittelwert.α X Stdev[αX]=|α|Stdev[X]
√x2+y2+z2−−−−−−−−−−√
Standardabweichung und die NormL2
Fall mit endlicher Dimension:
In einem dimensionalen Vektorraum ist die Standard- Norm , auch bekannt als die Norm, wie folgt definiert:n L2
Im weiteren Sinne nimmt die -norm die te Wurzel, um absolut zu werden Homogenität: .p ∥x∥p=(∑i|xi|p)1p p ∥αx∥p=(∑i|αxi|p)1p=|α|(∑i|xi|p)1p=|α|∥x∥p
Wenn Sie die Gewichte ist die gewichtete Summe ebenfalls eine gültige Norm. Außerdem ist es die Standardabweichung, wenn Wahrscheinlichkeiten undqi ∑ix2iqi−−−−−−√ qi E[x]≡∑ixiqi=0
Fall mit unendlicher Dimension:
In einem unendlich dimensionalen Hilbert-Raum können wir auf ähnliche Weise die Norm definieren :L2
Wenn eine Zufallsvariable mit dem Mittelwert Null ist und das Wahrscheinlichkeitsmaß ist, wie lautet die Standardabweichung? Es ist dasselbe: .X P ∫ωX(ω)2dP(ω)−−−−−−−−−−−−√
Zusammenfassung:
Unter Verwendung der Quadratwurzel ergibt sich , dass die Standardabweichung die absolute Homogenität erfüllt , eine geforderte Eigenschaft einer Norm .
In einem Raum von Zufallsvariablen ist ein inneres Produkt und das Norm durch das innere Produkt induziert . Somit ist die Standardabweichung die Norm einer erniedrigten Zufallsvariablen: Es ist ein Maß für die Entfernung vom Mittelwert zu .⟨X,Y⟩=E[XY] ∥X∥2=E[X2]−−−−−√ Stdev[X]=∥X−E[X]∥2 E[X] X
(Technischer Punkt: Während eine Norm ist, ist die Standardabweichung ist keine Norm über Zufallsvariablen in der Regel , weil eine Voraussetzung für einen normierter Vektorraum ist , wenn und nur wenn . eine Standardabweichung von 0 doesn‘ t implizieren, dass die Zufallsvariable das Nullelement ist.)E[X2]−−−−−√ E[(X−E[X])2]−−−−−−−−−−−−√ ∥x∥=0 x=0
quelle
Die Varianz von ist definiert als , es ist also eine Erwartung einer quadratischen Differenz zwischen X und seinem erwarteten Wert.X V(X)=E(X−E(X))2
Wenn die Zeit in Sekunden ist, ist in Sekunden, aber ist in und ist wieder in Sekunden.X X−E(X) V(X) seconds2 V(X)−−−−−√
quelle
Die einfache Antwort lautet, dass die Einheiten auf derselben Skala wie der Mittelwert liegen. Beispiel: Ich schätze den Mittelwert für einen Sekundarschüler auf 160 cm mit einer Standardabweichung (SD) von 20 cm. Es ist intuitiv einfacher, mit der SD ein Gefühl für die Abweichung zu bekommen, als mit der Abweichung von 400 cm ^ 2.
quelle
Einfacher ausgedrückt ist die Standardabweichung so ausgelegt, dass sie uns eine positive Zahl gibt, die etwas über die Verbreitung unserer Daten über ihren Mittelwert aussagt.
Wenn wir nur die Abstände aller Punkte vom Mittelwert addieren, werden die Punkte in positiver und negativer Richtung so kombiniert, dass sie sich tendenziell zum Mittelwert zurückziehen und Informationen über die Streuung verloren gehen. Deshalb messen wir zuerst die Varianz, damit alle Abstände durch Quadrieren als positive Größen erhalten bleiben und sich nicht gegenseitig aufheben. Am Ende wollen wir einen positiven Wert, der die Einheiten darstellt, mit denen wir begonnen haben - dies wurde bereits oben kommentiert -, also nehmen wir die positive Quadratwurzel.
quelle
Es ist eine historische Dummheit, die wir aufgrund intellektueller Faulheit fortsetzen. Sie haben sich entschieden, die Differenzen vom Mittelwert zu quadrieren, um das Minuszeichen zu beseitigen. Dann nahmen sie die Quadratwurzel, um sie auf eine dem Mittelwert ähnliche Skala zu bringen.
Jemand sollte neue Statistiken erstellen, Varianz und SD unter Verwendung des Moduls oder der absoluten Werte der Abweichung vom Mittelwert berechnen. Dies würde diese ganze Quadratur loswerden und dann das Quadratwurzelgeschäft übernehmen.
quelle