Dieser Artikel steht über meiner Liga, aber er spricht über ein Thema, das mich interessiert, die Beziehung zwischen Mittelwert, Modus und Median. Es sagt :
Es wird allgemein angenommen, dass der Median einer unimodalen Verteilung "normalerweise" zwischen dem Mittelwert und dem Modus liegt. Dies ist jedoch nicht immer wahr ...
Meine Frage : Kann jemand Beispiele für kontinuierliche unimodale (idealerweise einfache) Verteilungen liefern, bei denen der Median außerhalb des Intervalls [Modus, Mittelwert] liegt? Zum Beispiel eine Distribution wie mode < mean < median
.
=== EDIT =======
Es gibt bereits gute Antworten von Glen_b und Francis, aber mir wurde klar, dass ich wirklich an einem Beispiel interessiert bin, bei dem Modus <Mittelwert <Median oder Median <Mittelwert <Modus (dh Median liegt außerhalb von [Modus, Mittelwert] UND Median ist) "auf derselben Seite" als Mittelwert des Modus (dh sowohl über als auch unter dem Modus)). Ich kann die Antworten hier akzeptieren, wenn eine neue Frage offen ist oder kann jemand hier direkt eine Lösung vorschlagen?
Antworten:
Sicher, es ist nicht schwer, Beispiele zu finden - auch kontinuierliche unimodale -, bei denen der Median nicht zwischen dem Mittelwert und dem Modus liegt.
Man betrachte iid aus einer Dreiecksverteilung der Form f T ( t ) = 2 ( 1 - t ) 1 0 < t < 1T1,T2 fT(t)=2(1−t)10<t<1
Nun sei eine 60-40 Mischung aus T 1 und - 4 T 2 .X T1 −4T2
Die Dichte von sieht folgendermaßen aus:X
Der Mittelwert liegt unter 0, der Modus liegt bei 0, aber der Median liegt über 0. Eine geringfügige Änderung würde ein Beispiel ergeben, bei dem sogar die Dichte (und nicht nur das PDF) kontinuierlich war, die Beziehung zwischen den Standortmaßen jedoch das gleiche (bearbeiten: siehe 3. unten).
Verallgemeinern wir, setzen wir einen Anteil (mit 0 < p < 1 ) der Gesamtwahrscheinlichkeit in das rechte Dreieck und einen Anteil ( 1 - p ) in das linke Dreieck (anstelle von 0,6 und 0,4) wir hatten vorher). Stellen Sie außerdem den Skalierungsfaktor für die linke Hälfte - β anstelle von - 4 (mit β > 0 ) ein:p 0<p<1 (1−p) −β −4 β>0
Nehmen wir nun befindet sich der Median immer in dem Intervall, das vom rechtwinkligen Dreieck abgedeckt wird, sodass der Median den Modus überschreitet (der immer bei0bleibt). Insbesondere wennp>1p>12 0 liegt der Median bei1-1/√p>12 .1−1/2p−−√
Der Mittelwert liegt bei .(p−β(1−p))/3
Wenn ist, liegt der Mittelwert unter dem Modus, und wenn β < p / ( 1 - p ) liegt, liegt der Mittelwert über dem Modus.β>p/(1−p) β<p/(1−p)
Andererseits wollen wir , um den Mittelwert unter dem Median zu halten.(p−β(1−p))/3<1−1/2p−−√
Betrachten Sie ; Dadurch wird der Median über dem Modus angezeigt.p=0.7
Dann würde β < p / ( 1 - p ) erfüllen, so dass der Mittelwert über dem Modus liegt.β=2 β<p/(1−p)
Der Median liegt tatsächlich bei während der Mittelwert bei 0,7 - 2 ( 0,3 ) liegt1−1/1.4−−−√≈0.1548 . Daherhaben wirfürp=0,7undβ=2 denModus <Mittelwert <Median.0,7 - 2 (0.3)3≈ 0,0333 p = 0,7 β= 2
(NB Aus Gründen der Übereinstimmung mit meiner Notation sollte die Variable auf der x-Achse für beide Diagramme statt t sein, aber ich werde nicht zurückgehen und sie korrigieren.)x t
Dies ist ein Beispiel, bei dem die Dichte selbst kontinuierlich ist. Es basiert auf dem Ansatz in 1. und 2. oben, wobei jedoch der "Sprung" durch eine steile Steigung ersetzt wurde (und dann die gesamte Dichte um 0 gedreht wurde, weil ich ein Beispiel möchte, das rechtwinklig aussieht).
[Unter Verwendung des Ansatzes "Mischung dreieckiger Dichten" kann es als Mischung von 3 unabhängigen skalierten Variablen der in Abschnitt 1 beschriebenen dreieckigen Form erzeugt werden. Wir haben jetzt 15% , 60% - 3 T 2 und 25% 5 T 3. ]T1 −3T2 5T3
Wie wir im obigen Diagramm sehen, liegt der Mittelwert wie gewünscht in der Mitte.
Beachten Sie, dass m_t_ den Weibull in Kommentaren erwähnt (für die der Median außerhalb des Intervalls für einen kleinen Bereich des Formparameters k liegt ). Dies ist möglicherweise zufriedenstellend, da es sich um eine bekannte unimodale kontinuierliche (und reibungslose) Verteilung mit einfacher funktionaler Form handelt.[mode,mean] k
Insbesondere für kleine Werte des Weibull-Formparameters ist die Verteilung rechtwinklig, und wir haben die übliche Situation des Medians zwischen dem Modus und dem Mittelwert, während für große Werte des Weibull-Formparameters die Verteilung linksversetzt ist und wir haben wieder diese "Median in der Mitte" -Situation (aber jetzt mit dem Modus rechts und nicht mit dem Mittelwert). Dazwischen befindet sich eine kleine Region, in der der Median außerhalb des Mittelwert-Intervalls liegt, und in der Mitte kreuzen sich Mittelwert und Modus:
Wenn wir in den oben mit (1) und (2) gekennzeichneten Intervallen geeignete Werte für den Formparameter auswählen - solche, bei denen die Lücken zwischen den Standortstatistiken ungefähr gleich sind - erhalten wir:
Obwohl diese die Anforderungen erfüllen, sind die drei Standortparameter leider so nahe beieinander, dass wir sie visuell nicht unterscheiden können (sie fallen alle in dasselbe Pixel), was ein wenig enttäuschend ist - die Fälle für meine früheren Beispiele sind viel mehr getrennt. (Dennoch schlägt es Situationen vor, die mit anderen Verteilungen untersucht werden sollten, von denen einige Ergebnisse ergeben könnten, die visuell unterschiedlicher sind.)
quelle
Das folgende Beispiel stammt aus Jordan Stoyanovs Gegenbeispielen zur Wahrscheinlichkeit .
quelle
Nehmen Sie die Exponentialverteilung mit dem Ratenparameter a und der Dichte a exp (-ax) für 0 <= x <unendlich. Der Modus ist bei Null. Natürlich sind der Mittelwert und der Median größer als 0. Das cdf ist 1-exp (-ax). Also für den Median lösen Sie für exp (-ax) = 0,5 für x. Dann ist -ax = ln (0,5) oder x = -ln (0,5) / a. Integrieren Sie für den Mittelwert ax exp (-ax) von 0 bis unendlich. Nehmen Sie a = 1 und wir haben einen Median = -ln (0,5) = ln (2) und einen Mittelwert = 1.
Also Modus <Median <Mittelwert.
quelle