Ich denke, der Median Mittelwert.
Ist das der Fall?
distributions
self-study
mean
skewness
median
Kunjan Kshetri
quelle
quelle
Antworten:
Es ist eine nicht triviale Frage (sicherlich nicht so trivial wie die Leute, die die Frage stellen, zu denken scheinen).
Die Schwierigkeit wird letztendlich durch die Tatsache verursacht, dass wir nicht wirklich wissen, was wir unter "Schräglauf" verstehen - oft ist es irgendwie offensichtlich, aber manchmal ist es wirklich nicht. Angesichts der Schwierigkeit, das, was wir unter "Ort" und "Verbreitung" verstehen, in nichttrivialen Fällen festzuhalten (zum Beispiel ist der Mittelwert nicht immer das, was wir meinen, wenn wir über Ort sprechen), sollte es keine große Überraschung sein, dass ein subtilerer ist Konzept wie Schiefe ist mindestens so rutschig. Dies veranlasst uns, verschiedene algebraische Definitionen zu versuchen, die nicht immer übereinstimmen.
1) Wenn Sie die Schiefe mit dem zweiten Pearson-Schiefe-Koeffizienten messen , ist der Mittelwert ( ) kleiner als der Median ( ∼ μ - dh in diesem Fall haben Sie ihn umgekehrt).μ μ∼
Die (Populations-) zweite Pearson-Schiefe beträgt Und wird negativ ( "links Skew")wenn sein μ < ~ μ .
Die Beispielversionen dieser Statistiken funktionieren ähnlich.
Der Grund für die notwendige Beziehung zwischen Mittelwert und Median ist in diesem Fall, dass das Skewness-Maß so definiert ist.
Hier ist eine linksgerichtete Dichte (sowohl nach dem zweiten Pearson-Maß als auch nach dem allgemeineren Maß in (2) unten):
Der Median ist am unteren Rand grün markiert, der Mittelwert rot.
Ich gehe davon aus, dass die Antwort, die Sie geben sollen, lautet, dass der Mittelwert unter dem Median liegt. Dies ist normalerweise bei den Arten von Distributionen der Fall, denen wir normalerweise Namen geben.
(Aber lesen Sie weiter und sehen Sie, warum dies als allgemeine Aussage nicht korrekt ist.)
2) Wenn Sie es am üblicheren standardisierten dritten Moment messen , dann ist es häufig, aber keineswegs immer, der Fall, dass der Mittelwert unter dem Median liegt.
Das heißt, es ist möglich, Beispiele zu konstruieren, bei denen das Gegenteil zutrifft oder bei denen ein Skewness-Maß Null ist, während das andere nicht Null ist.
Das heißt, es gibt keine notwendige Beziehung zwischen den Orten des Mittelwerts, des Medians und der Momentverschiebung.
Betrachten Sie zum Beispiel das folgende Beispiel (dasselbe Beispiel kann als diskrete Wahrscheinlichkeitsverteilung konstruiert werden):
Der (Fisher-, Third-Moment-) Skewness-Koeffizient ist jedoch negativ (dh durch seine Lichter haben wir Links-Skew-Daten), da die Summe der Würfel der Abweichungen vom Mittelwert negativ ist.
In diesem Fall also links, aber mittlerer> Wert.
(Wenn Sie dagegen im obigen Beispiel 2.7 in 3 ändern, haben Sie ein Beispiel, in dem die Momentschiefe Null ist, der Mittelwert jedoch den Median überschreitet. Wenn Sie 3.3 festlegen, ist die Momentschiefe positiv , und der Mittelwert übersteigt den Median - dh liegt schließlich in der 'erwarteten' Richtung.)
Wenn Sie die erste Pearson-Schiefe anstelle einer der obigen Definitionen verwenden, haben Sie ein ähnliches Problem wie in diesem Fall - die Richtung der Schiefe bestimmt nicht das Verhältnis zwischen Mittelwert und Median im Allgemeinen.
Bearbeiten: als Antwort auf eine Frage in Kommentaren - ein Beispiel, bei dem der Mittelwert und der Median gleich sind, die Momentschiefe jedoch negativ ist. Betrachten Sie die folgenden Daten (wie zuvor gilt dies auch als Beispiel für eine diskrete Population; schreiben Sie die Zahlen auf die Gesichter eines Würfels).
Sowohl der Mittelwert als auch der Median sind 6, aber die Summe der Abweichungswürfel vom Mittelwert ist negativ, sodass die Schiefe des dritten Moments negativ ist.
quelle
Nein. Linksgerichtete Daten haben einen langen Schwanz links (unteres Ende), sodass der Mittelwert normalerweise unter dem Median liegt. (Eine Ausnahme finden Sie in der Antwort von @Glen_b.) Gelegentlich denke ich, dass Daten, die nach links verzerrt "aussehen", weniger als den Median bedeuten.
Richtig verzerrte Daten sind häufiger anzutreffen. zum Beispiel Einkommen. Dort ist der Mittelwert größer als der Median.
R-Code
quelle