Wie ist die Beziehung zwischen Mittelwert und Median bei Daten mit Linksschrägstellung?

12

Ich denke, der Median Mittelwert.

Ist das der Fall?

Kunjan Kshetri
quelle
2
Welcher offene MOOC-Kurs ist das? Was schlagen die Kursmaterialien für eine Antwort vor?
Glen_b -Reinstate Monica
1
class.stanford.edu/courses/Medicine/HRP258/… . Der Kurs ist vorbei.
Kunjan Kshetri
1
Danke, das ist zumindest ein Zusammenhang, obwohl es nur noch wöchentliche Lesungen gibt, die nicht viel Licht auf dieses Thema werfen. Ich frage mich, was der Kurs zu diesem Thema zu sagen hatte.
Glen_b

Antworten:

16

Es ist eine nicht triviale Frage (sicherlich nicht so trivial wie die Leute, die die Frage stellen, zu denken scheinen).

Die Schwierigkeit wird letztendlich durch die Tatsache verursacht, dass wir nicht wirklich wissen, was wir unter "Schräglauf" verstehen - oft ist es irgendwie offensichtlich, aber manchmal ist es wirklich nicht. Angesichts der Schwierigkeit, das, was wir unter "Ort" und "Verbreitung" verstehen, in nichttrivialen Fällen festzuhalten (zum Beispiel ist der Mittelwert nicht immer das, was wir meinen, wenn wir über Ort sprechen), sollte es keine große Überraschung sein, dass ein subtilerer ist Konzept wie Schiefe ist mindestens so rutschig. Dies veranlasst uns, verschiedene algebraische Definitionen zu versuchen, die nicht immer übereinstimmen.

1) Wenn Sie die Schiefe mit dem zweiten Pearson-Schiefe-Koeffizienten messen , ist der Mittelwert ( ) kleiner als der Median ( μ - dh in diesem Fall haben Sie ihn umgekehrt).μμ

Die (Populations-) zweite Pearson-Schiefe beträgt Und wird negativ ( "links Skew")wenn sein μ < ~ μ .

3(μμ)σ,
μ<μ

Die Beispielversionen dieser Statistiken funktionieren ähnlich.

Der Grund für die notwendige Beziehung zwischen Mittelwert und Median ist in diesem Fall, dass das Skewness-Maß so definiert ist.

Hier ist eine linksgerichtete Dichte (sowohl nach dem zweiten Pearson-Maß als auch nach dem allgemeineren Maß in (2) unten):

Bildbeschreibung hier eingeben

Der Median ist am unteren Rand grün markiert, der Mittelwert rot.

Ich gehe davon aus, dass die Antwort, die Sie geben sollen, lautet, dass der Mittelwert unter dem Median liegt. Dies ist normalerweise bei den Arten von Distributionen der Fall, denen wir normalerweise Namen geben.

(Aber lesen Sie weiter und sehen Sie, warum dies als allgemeine Aussage nicht korrekt ist.)


2) Wenn Sie es am üblicheren standardisierten dritten Moment messen , dann ist es häufig, aber keineswegs immer, der Fall, dass der Mittelwert unter dem Median liegt.

Das heißt, es ist möglich, Beispiele zu konstruieren, bei denen das Gegenteil zutrifft oder bei denen ein Skewness-Maß Null ist, während das andere nicht Null ist.

Das heißt, es gibt keine notwendige Beziehung zwischen den Orten des Mittelwerts, des Medians und der Momentverschiebung.

Betrachten Sie zum Beispiel das folgende Beispiel (dasselbe Beispiel kann als diskrete Wahrscheinlichkeitsverteilung konstruiert werden):

  2.7 15.0 15.0 15.0 30.0 30.0

mean: 17.95
median: 15

Der (Fisher-, Third-Moment-) Skewness-Koeffizient ist jedoch negativ (dh durch seine Lichter haben wir Links-Skew-Daten), da die Summe der Würfel der Abweichungen vom Mittelwert negativ ist.

In diesem Fall also links, aber mittlerer> Wert.

(Wenn Sie dagegen im obigen Beispiel 2.7 in 3 ändern, haben Sie ein Beispiel, in dem die Momentschiefe Null ist, der Mittelwert jedoch den Median überschreitet. Wenn Sie 3.3 festlegen, ist die Momentschiefe positiv , und der Mittelwert übersteigt den Median - dh liegt schließlich in der 'erwarteten' Richtung.)

Wenn Sie die erste Pearson-Schiefe anstelle einer der obigen Definitionen verwenden, haben Sie ein ähnliches Problem wie in diesem Fall - die Richtung der Schiefe bestimmt nicht das Verhältnis zwischen Mittelwert und Median im Allgemeinen.


Bearbeiten: als Antwort auf eine Frage in Kommentaren - ein Beispiel, bei dem der Mittelwert und der Median gleich sind, die Momentschiefe jedoch negativ ist. Betrachten Sie die folgenden Daten (wie zuvor gilt dies auch als Beispiel für eine diskrete Population; schreiben Sie die Zahlen auf die Gesichter eines Würfels).

 1  5  6  6  8 10

Sowohl der Mittelwert als auch der Median sind 6, aber die Summe der Abweichungswürfel vom Mittelwert ist negativ, sodass die Schiefe des dritten Moments negativ ist.

Glen_b - Setzen Sie Monica wieder ein
quelle
1
@Peter Entschuldigung für die langsame Antwort, ich war gerade dabei, solche Beispiele zu konstruieren und habe Ihre Frage nicht gesehen.
Glen_b -Reinstate Monica
2
Ich habe viele Lehrbuchdefinitionen gesehen und keine erwähnte dies. Cool.
Peter Flom - Reinstate Monica
6
@Peter Leider wiederholen viele Grundlehrbücher einfach falsche Informationen aus anderen Lehrbüchern, ohne selbst eine echte Untersuchung durchzuführen, und so wird ein grundlegendes Missverständnis verbreitet. Gegenbeispiele sind, wie Sie sehen, relativ einfach zu konstruieren (ich mache sie nur von Hand, wenn nötig). Kendall und Stuart ( Advanced Theory of Statistics, Bd. I - lassen Sie sich nicht vom Titel abschrecken, es ist gut lesbar) haben zumindest die dritte und vierte Ausgabe gute Informationen. Neuere Ausgaben sind von Stuart und Ord. Ich habe dieses Problem bereits mehrmals im Lebenslauf gepostet.
Glen_b -Reinstate Monica
4
(5k)0.8k0.25k(5k)0.2k0.85k=
1
@Nick Ja, Binomialzahlen mit ganzzahligem Mittelwert sind gute Beispiele.
Glen_b
5

Nein. Linksgerichtete Daten haben einen langen Schwanz links (unteres Ende), sodass der Mittelwert normalerweise unter dem Median liegt. (Eine Ausnahme finden Sie in der Antwort von @Glen_b.) Gelegentlich denke ich, dass Daten, die nach links verzerrt "aussehen", weniger als den Median bedeuten.

Richtig verzerrte Daten sind häufiger anzutreffen. zum Beispiel Einkommen. Dort ist der Mittelwert größer als der Median.

R-Code

set.seed(123)  #set random seed
normdata <- rnorm(1000) #Normal data, skew = 0
extleft <- c(rep(-10, 5), rep(-20, 5)) #Some data to make skew left
alldata <- c(normdata,extleft)

library(moments)
skewness(alldata) #-6.77
mean(alldata) #-0.13
median(alldata) #-0.001
Peter Flom - Wiedereinsetzung von Monica
quelle
Kann der Mittelwert jemals dem Median entsprechen?
Kunjan Kshetri
unj2 Ich habe meiner Antwort ein Beispiel hinzugefügt, in dem die Schiefe im dritten Moment negativ ist, aber mean = median.
Glen_b -Reinstate Monica