Heute unterrichtete ich eine Einführungsklasse für Statistik und ein Schüler kam auf mich zu und stellte mir die Frage, die ich hier umformuliere: "Warum wird die Standardabweichung als Abweichungsquadrat und nicht als Quadratsumme über N definiert?"
Wir definieren die Populationsvarianz:
Und Standardabweichung: .
Die Interpretation, die wir zu geben können, ist, dass es die durchschnittliche Abweichung von Einheiten in der Bevölkerung vom Bevölkerungsmittel von .X
In der Definition von sd dividieren wir jedoch die Quadratsumme durch . Die Frage, die der Schüler stellt, ist, warum wir nicht stattdessen das Quadrat der Quadratsumme durch teilen . So kommen wir zur Konkurrenzformel:Der Student argumentierte, dass diese Formel eher wie eine "durchschnittliche" Abweichung vom Mittelwert aussieht als beim Dividieren durch wie in . Nσ n e w = 1√
Ich fand diese Frage nicht dumm. Ich möchte dem Studenten eine Antwort geben, die weiter geht als zu sagen, dass die SD als Quadrat der Varianz definiert ist, die die durchschnittliche quadratische Abweichung ist. Anders ausgedrückt, warum sollte die Schülerin die richtige Formel verwenden und nicht ihrer Idee folgen?
Diese Frage bezieht sich auf einen älteren Thread und die hier angegebenen Antworten . Die Antworten gehen in drei Richtungen:
- ist die Abweichung vom quadratischen Mittelwert (RMS), nicht die "typische" Abweichung vom Mittelwert (dh ). Somit ist es anders definiert.
- Es hat schöne mathematische Eigenschaften.
- Darüber hinaus würde der sqrt "Einheiten" auf ihren ursprünglichen Maßstab zurückbringen. Dies wäre jedoch auch für der Fall , das stattdessen durch dividiert . N
Die beiden Punkte 1 und 2 sind Argumente zugunsten von sd als RMS, aber ich sehe kein Argument gegen die Verwendung von . Was wären die guten Argumente, um Einsteiger von der Verwendung des durchschnittlichen RMS-Abstands vom Mittelwert zu überzeugen ? σ
"Why is the standard deviation defined as sqrt of variance and not as average of [the root of] sum of squares?"
Könnte es sein, dass was in Klammern steht irgendwie in der Frage verloren gegangen ist?Antworten:
Es gibt mindestens drei grundlegende Probleme, die Anfängern leicht erklärt werden können:
Die "neue" SD ist nicht einmal für unendliche Populationen definiert. (Man könnte es in solchen Fällen immer als Null deklarieren, aber das würde es nicht nützlicher machen.)
Die neue SD verhält sich nicht so, wie es ein Durchschnitt unter Zufallsstichproben tun sollte.
Obwohl die neue SD kann mit allen mathematischen Strenge verwendet werden , Abweichungen von einem Mittelwert zu beurteilen (in Proben und endlichen Populationen), wird seine Interpretation unnötig kompliziert.
1. Die Anwendbarkeit des neuen SD ist begrenzt
Punkt (1) könnte auch für diejenigen, die sich mit Integration nicht auskennen, deutlich gemacht werden, da die Varianz eindeutig ein arithmetisches Mittel (der quadratischen Abweichungen) ist und eine sinnvolle Erweiterung auf Modelle "unendlicher" Populationen darstellt, für die die Die Anschauung über die Existenz eines arithmetischen Mittels ist immer noch gültig. Daher ist seine Quadratwurzel - die übliche SD - auch in solchen Fällen perfekt definiert und in seiner Rolle ebenso nützlich wie eine (nichtlineare Reexpression von) einer Varianz. Die neue SD dividiert diesen Durchschnitt jedoch durch das willkürlich große , was ihre Verallgemeinerung über endliche Populationen und endliche Stichproben hinaus problematisch macht: Was sollte in solchen Fällen als gleich genommen werden? 1/ √N--√ 1 / N--√
2. Die neue SD ist kein Durchschnitt
Jede Statistik, die den Namen "Durchschnitt" verdient, sollte die Eigenschaft haben, dass sie mit zunehmender Größe einer Zufallsstichprobe aus der Bevölkerung gegen den Bevölkerungswert konvergiert. Jedes feste Vielfache der SD hätte diese Eigenschaft, da der Multiplikator sowohl für die Berechnung der Stichproben-SD als auch der Populations-SD gilt. (Obwohl dies dem Argument von Alecos Papadopoulos nicht direkt widerspricht, deutet diese Beobachtung darauf hin, dass das Argument nur tangential zu den tatsächlichen Problemen ist.) Die "neue" SD ist jedoch offensichtlich gleich dem -fachen der üblichen Konvergiert unter allen Umständen gegen wenn die Stichprobengröße groß wird. Daher gilt zwar für jede feste Stichprobengröße 0NN1 / N--√ 0 N N Die neue SD (angemessen interpretiert) ist ein vollkommen angemessenes Maß für die Abweichung vom Mittelwert. Sie kann nicht zu Recht als universelles Maß angesehen werden, das bei gleicher Interpretation für alle Stichprobengrößen gilt, und sie kann in keinem Fall korrekt als "Durchschnitt" bezeichnet werden nützlicher Sinn.
3. Die neue SD ist kompliziert zu interpretieren und zu verwenden
Betrachten Sie die Entnahme von Proben der Größe . Die neue SD ist in diesen Fällen das fache der üblichen SD. Es verfügt daher über vergleichbare Interpretationen, wie zum Beispiel ein Analogon der 68-95-99-Regel (ungefähr 68% der Daten sollten innerhalb von zwei neuen SDs des Mittelwerts liegen, 95% von ihnen innerhalb von vier neuen SDs des Mittelwerts usw.) . und Versionen klassischer Ungleichungen wie die von Chebychev werden gelten (nicht mehr als der Daten können mehr als neue SDs vom Mittelwert entfernt sein), und der zentrale Grenzwertsatz kann in Bezug auf die neue SD analog angepasst werden (man dividiert durch1 / √N= 4 1/k22k √1/ N--√= 1 / 2 1 / k2 2 k √N--√ mal die neue SD um die Variable zu standardisieren). In diesem spezifischen und eindeutig eingeschränkten Sinne ist der Vorschlag des Schülers also nicht falsch. Die Schwierigkeit besteht jedoch darin, dass alle diese Anweisungen - ganz explizit - Faktoren von . Obwohl dies kein inhärentes mathematisches Problem darstellt, erschwert es sicherlich die Aussagen und die Interpretation der grundlegendsten Gesetze der Statistik.N--√= 2
Es ist anzumerken, dass Gauß und andere ursprünglich die Gauß-Verteilung durch parametrisierten und effektiv das -fache der SD verwendeten, um die Streuung einer normalen Zufallsvariablen zu quantifizieren. Diese historische Verwendung demonstriert die Angemessenheit und Wirksamkeit der Verwendung anderer fester Vielfacher des SD an dessen Stelle. √2-√σ 2-√
quelle
Angenommen, Ihre Stichprobe enthält nur zwei Realisierungen. Ich denke, ein intuitives Maß für die Streuung wäre die durchschnittliche absolute Abweichung (AAD).
Wir möchten also, dass andere Dispersionsmaße auf der gleichen Ebene der Maßeinheiten "nahe" an den obigen liegen.
Die Stichprobenvarianz ist definiert als
dh wir hätten das "intuitive" Maß der Streuung "heruntergespielt", während wir, wenn wir die Standardabweichung wie definiert betrachtet hätten,
und
Wir können die rechte Seite des Varianzausdrucks als schreiben
quelle