Berechnen Sie die Varianz, ohne den Mittelwert zu berechnen

7

Können wir die Varianz berechnen, ohne den Mittelwert als Basispunkt zu verwenden?

Wille
quelle
3
Bei E(X2)< ist die Varianz per Definition gegeben durch σ2=E((XE(X))2) . Das Formular vereinfacht sich zu σ2=E(X2)E(X)2 . Dh für die Varianz benötigen Sie E(X) . Natürlich können Sie Ihr eigenes Dispersionsmaß mithilfe einer anderen Statistik definieren ... oder eines aus den Antworten verwenden.
BloXX
5
Kurze Antwort: Viele andere Möglichkeiten, die Variabilität (Streuung, Streuung, Skalierung) zusammenzufassen, aber keine der anderen wäre die Varianz. (Tatsächlich kann die Varianz ohne Bezugnahme auf den Mittelwert definiert werden.)
Nick Cox
3
Ja: Berechnen Sie bei gegebenen Daten die Kovarianz von wie unter stats.stackexchange.com/a/18200/919 beschrieben . Diese Methode berechnet niemals den Mittelwert. X,(X,X)
whuber

Antworten:

12

Die absolute Medianabweichung ist definiert als und wird als Alternative zur Standardabweichung angesehen. Aber dies ist nicht die Varianz. Insbesondere existiert immer, ob Momente zulässt oder nicht . Zum Beispiel ist die MAD eines Standard-Cauchy gleich eins, da

MAD(X)=median|Xmedian(X)|
X
P(|X0|<1)0 is the median=arctan(1)/πarctan(1)/π=12

Xi'an
quelle
7
Neulinge dieser Idee sollten auch auf die mittlere absolute Abweichung vom Mittelwert (häufig mittlere Abweichung) und die mittlere absolute Abweichung vom Mittelwert achten. Ich erinnere mich nicht an die mittlere absolute Abweichung vom Median, bin aber offen für Beispiele. Die Abkürzung MAD wurde leider unterschiedlich angewendet. Vertrauen Sie also zuerst dem Code der Menschen, dann ihrer algebraischen oder verbalen Definition, aber verwenden Sie die Abkürzung MAD nur überhaupt nicht. In symmetrischen Verteilungen und einigen anderen ist MAD, wie hier definiert, die Hälfte des Interquartilbereichs. (Punning auf MAD Ich widersetze mich als etwas zu offensichtlich.)
Nick Cox
3
Beachten Sie außerdem, dass Software-Implementierungen der Median-Absolutabweichungsfunktion den MAD-Wert um einen konstanten Faktor aus der in dieser Antwort dargestellten Form skalieren können, sodass sein Wert mit der Standardabweichung für eine Normalverteilung übereinstimmt.
EdM
@EdM Ausgezeichneter Punkt. Persönlich mag ich diese Praxis nicht, es sei denn, die Leute verwenden einen anderen Begriff. Es ist nicht mehr der WÜTENDE!
Nick Cox
1
@NickCox: Der Reiz der Zentrierung auf den Median besteht darin, dass die Menge immer existiert, unabhängig davon, ob die Verteilung einen Mittelwert aufweist oder nicht. Dies ist die Definition in Wikipedia .
Xi'an
MAD ist gegenseitig versicherte Zerstörung
kjetil b halvorsen
3

Auf Math.stackexchange gibt es bereits eine Lösung für diese Frage :

Ich fasse die Antworten zusammen:

  1. Sie können verwenden, dass die Varianz , was nur einen Durchgang erfordert (Berechnung des Mittelwerts und des Mittelwerts der Quadrate gleichzeitig), aber anfälliger für Rundungsfehler sein kann, wenn Die Varianz ist im Vergleich zum Mittelwert gering.x2¯x¯2

  1. Wie wäre es mit der Summe der quadratischen paarweisen Differenzen? In der Tat können Sie dies durch direkte Berechnung überprüfen

2vX=1n(n1)1i<jn(xixj)2.


  1. Die Stichprobenvarianz ohne Mittelwert wird berechnet als:
    vX=1n1[i=1nxi21n(i=1nxi)2]
Ferdi
quelle