Bezeichne den Mittelwert ( Durchschnitt), den Median, die Standardabweichung und den Modus. Schließlich sei die Stichprobe, eine Realisierung einer stetigen unimodalen Verteilung für die die ersten beiden Momente existieren.μ≠mσMXF
Das ist bekannt
|μ−m|≤σ(1)
Dies ist eine häufige Schulbuchübung:
|μ−m|=≤≤=≤=|E(X−m)|E|X−m|E|X−μ|E(X−μ)2−−−−−−−√E(X−μ)2−−−−−−−−−√σ
Die erste Gleichheit ergibt sich aus der Definition des Mittelwerts, der dritte entsteht, weil der Median der eindeutige Minimierer (unter allen ) vonund die vierte aus Jensens Ungleichung (dh der Definition einer konvexen Funktion). Tatsächlich kann diese Ungleichung verschärft werden. Tatsächlich kann für jedes , das die obigen Bedingungen erfüllt, gezeigt werden [3], dass
cE|X−c|F
|m−μ|≤0.6−−−√σ(2)
Auch wenn es im Allgemeinen nicht wahr ist ( Abadir, 2005 ), dass eine unimodale Verteilung entweder erfüllen muss,
kann dennoch gezeigt werden, dass Ungleichheit
M≤m≤μ or M≥m≥μ
|μ−M|≤3–√σ(3)
gilt für jede unimodale, quadratisch integrierbare Verteilung (unabhängig vom Versatz). Dies wird offiziell in Johnson und Rogers (1951) bewiesen, obwohl der Beweis von vielen Hilfsspelzen abhängt, die hier nur schwer passen. Sehen Sie sich das Original an.
Eine ausreichende Bedingung für eine Verteilung , um zu erfüllen, ist in [2] gegeben. Wenn :Fμ≤m≤MF
F(m−x)+F(m+x)≥1 for all x(4)
dann . Wenn außerdem , dann ist die Ungleichung streng. Die Verteilungen Pearson Typ I bis XII sind ein Beispiel für eine Verteilungsfamilie, die [4] erfüllt zum Beispiel ist die Weibull eine übliche Verteilung, für die nicht gilt, siehe [5]).μ≤m≤Mμ≠m(4)(4)
Unter der Annahme, dass genau gilt und wlog den Wert , haben wir den
Wert(4)σ=1
3(m−μ)∈(0,30.6−−−√] and M−μ∈(m−μ,3–√]
und da der zweite dieser beiden Bereiche nicht leer ist, ist es sicherlich möglich, Verteilungen zu finden, für die die Behauptung wahr ist (z. B. wenn ) für einen gewissen Wertebereich der Verteilungsparameter, aber nicht für alle Verteilungen und nicht einmal für alle Verteilungen, die erfüllen .0<m−μ<3√3<σ=1(4)
- [0]: Das Momentanproblem für unimodale Verteilungen. NL Johnson und CA Rogers. Die Annalen der mathematischen Statistik, Vol. 22, No. 3 (Sep. 1951), S. 433-439
- [1]: Die Mean-Median-Mode-Ungleichung: Gegenbeispiele Karim M. Abadir Econometric Theory, Vol. 21, No. 2 (April 2005), S. 477-482
- [2]: WR van Zwet, Mittelwert, Median, Modus II, Statist. Neerlandica, 33 (1979), S. 1-5.
- [3]: Der Mittelwert, der Median und die Art der unimodalen Verteilung: Eine Charakterisierung. S. Basu und A. DasGupta (1997). Theory Probab. Appl., 41 (2), 210–223.
- [4]: Einige Anmerkungen zu Mittelwert, Median, Modus und Neigung. Michikazu Sato. Australian Journal of Statistics. Band 39, Ausgabe 2, Seiten 219–224, Juni 1997
- [5]: PT von Hippel (2005). Mittelwert, Median und Versatz: Korrigieren einer Lehrbuchregel. Journal of Statistics Education, Band 13, Nummer 2.
Das Papier chl zeigt auf einige wichtige Informationen - und zeigt damit, dass es sich nicht um eine allgemeine Regel handelt (auch nicht für kontinuierliche, glatte, "gut verhaltene" Variablen wie den Weibull). Obwohl dies oft ungefähr der Fall ist, ist dies häufig nicht der Fall.
Wo kommt Pearson her? Wie kam er zu dieser Annäherung?
Zum Glück sagt Pearson uns die Antwort ziemlich genau.
Die erste Verwendung des Begriffs "Versatz" in dem Sinne, dass wir ihn verwenden, scheint Pearson, 1895 [1] zu sein (sie erscheint direkt im Titel). In diesem Artikel wird anscheinend auch der Begriff Modus vorgestellt (Fußnote, S. 345):
Es scheint auch seine erste wirkliche Detaillierung seines Frequenzkurvensystems zu sein .
Bei der Erörterung der Schätzung des Formparameters in der Pearson- Typ-III- Verteilung (was wir jetzt als verschobenes - und möglicherweise gespiegeltes - Gamma bezeichnen) sagt er (S. 375):
* dies entspricht dem Gamma mit einem Formparameter>1
Und tatsächlich, wenn wir das Verhältnis von (Mittelwert) zu (Mittelwert-Median) für die Gammaverteilung betrachten, beobachten wir Folgendes:
(Der blaue Teil markiert die Region, in der Pearson sagt, dass die Annäherung angemessen ist).
In der Tat, wenn wir uns einige andere Distributionen im Pearson-System ansehen - sagen wir zum Beispiel die Beta-Distributionen -, dann gilt ungefähr dasselbe Verhältnis, solange und nicht zu klein sind:α β
(Die besondere Auswahl von Unterfamilien der Beta mit wurde getroffen, weil im Moment der Schiefe .) so, dass eine Erhöhung von für Konstante einer abnehmenden Momentenversetzung entspricht, interessanterweise für Werte von und wie , die Kurven sind fast konstant (Mittelwert) / (Mittelwert-Median), was darauf hindeutet, dass die Annäherung vernünftig ist, wenn ist groß genug, möglicherweise mit einem Minimum auf dem kleineren vonβ−−√−α−−√=k β−−√−α−−√ α β−−√−α−−√ α β β−−√+α−−√=c β−−√+α−−√ α und .)β
Das inverse Gamma ist auch im Pearson-System; es hat auch die Beziehung für große Werte des Formparameters (sagen wir ungefähr ):α>10
Es ist zu erwarten, dass Pearson auch mit der lognormalen Verteilung vertraut war. In diesem Fall sind der Modus, der Median und der Mittelwert jeweils und ; es wurde vor der Entwicklung seines Systems diskutiert und wird oft mit Galton in Verbindung gebracht.eμ−σ2,eμ eμ+σ2/2
Betrachten wir noch einmal (Mittelwert) / (Mittelwert-Median). Wenn wir einen Faktor von aus Zähler und Nenner streichen, bleibt . In erster Ordnung (die genau sein wird , wenn klein ist), wird der Zähler zu und der Nenner , so zumindest für small sollte es auch für das lognormal gelten.eμ eσ2/2−e−σ2eσ2/2−1 σ2 32σ2 12σ2 σ2
Es gibt eine ganze Reihe bekannter Distributionen - von denen einige Pearson bekannt waren -, für die es für einen weiten Bereich von Parameterwerten nahezu zutreffend ist. er bemerkte es mit der Gammaverteilung, hätte aber die Idee bestätigt, als er sich einige andere Verteilungen ansah, die er wahrscheinlich in Betracht ziehen würde.
[1]: Pearson, K. (1895),
"Beiträge zur mathematischen Evolutionstheorie, II: Abweichungen im homogenen Material",
Philosophical Transactions of the Royal Society, Reihe A, 186, 343-414
[ Nicht urheberrechtlich geschützt. Frei verfügbar hier ]
quelle
Diese Beziehung wurde nicht abgeleitet. Es wurde festgestellt, dass sich empirisch annähernd nahezu symmetrische Verteilungen halten . Siehe Jules Erklärung in Die Einführung in die Theorie der Statistik , (1922), S.121, Kapitel VII, Abschnitt 20. Er präsentiert das empirische Beispiel.
quelle