In welcher Beziehung steht der erwartete Wert zu Mittelwert, Median usw. in einer nicht normalen Verteilung?

9

In welcher Beziehung steht der erwartete Wert einer kontinuierlichen Zufallsvariablen zu ihrem arithmetischen Mittel, Median usw. in einer nicht normalen Verteilung (z. B. Skew-Normal)? Ich interessiere mich für alle gängigen / interessanten Distributionen (z. B. logarithmische, einfache bi / multimodale Distributionen, alles andere, was seltsam und wunderbar ist).

Ich suche hauptsächlich nach qualitativen Antworten, aber auch quantitative oder formelhafte Antworten sind willkommen. Ich würde besonders gerne visuelle Darstellungen sehen, die es klarer machen.

naught101
quelle
Kannst du etwas klarer sein? Das arithmetische Mittel und der Median sind Funktionen, die wir auf Daten anwenden, und nichts, was bestimmten Verteilungen eigen ist. Beispielsweise müssen Daten nicht normal sein, damit Sie den Stichprobenmittelwert berechnen können.
Gast
Ok, die Frage sollte also technisch lauten: "Wie hängt der erwartete Wert mit dem Mittelwert, dem Median usw. von Daten zusammen, die zufällig aus einer bestimmten Wahrscheinlichkeitsverteilung gezogen wurden?" Ich suche nach einfachen, intuitiven Erkenntnissen, ähnlich wie Sie intuitiv sagen können, dass der Median und der Mittelwert weiter voneinander entfernt sind, wenn eine Verteilung stärker verzerrt ist, und der Median möglicherweise einen besseren Hinweis darauf gibt, wo die Daten liegen.
Naught101
Heh. Danke Marco. Ich habe offensichtlich Dinge falsch gelesen. Kann ich das auch als Antwort schreiben, ich werde es bei der besten Antwort wählen.
naught101

Antworten:

8

(teilweise konvertiert von meinem jetzt gelöschten Kommentar oben)

Der erwartete Wert und das arithmetische Mittel sind genau dasselbe. Der Median ist nicht trivial mit dem Mittelwert verbunden, aber Sie können ein paar Dinge über ihre Beziehung sagen:

  • Wenn eine Verteilung symmetrisch ist, sind der Mittelwert und der Median gleich

  • Wenn eine Verteilung negativ verzerrt ist, ist der Median normalerweise größer als der Mittelwert

  • Wenn eine Verteilung positiv verzerrt ist, liegt der Median normalerweise unter dem Mittelwert

Makro
quelle
Interessant. Welche Beispiele gibt es für das ungewöhnliche Verhalten einer negativ verzerrten Verteilung, bei der der Mittelwert größer als der Median ist?
naught101
@ naught101: ist das ein Tippfehler? Eine negativ verzerrte Verteilung ist eine Verteilung, bei der die Ergebnisse links von der Mitte häufiger auftreten als die Ergebnisse rechts von der Mitte, und daher geht der "Schwanz" der niederfrequenten Ergebnisse nach rechts. In einer solchen Situation zieht der Buckel links immer den (arithmetischen) Mittelwert links von der Mitte, während der Schwanz rechts den Median größer als den Mittelwert hält.
Assad Ebrahim
@AssadEbrahim: Nein, es war ein Verweis auf Macros Kommentar "Der Median ist normalerweise größer als der Mittelwert" - ich habe nach Gegenbeispielen gefragt.
naught101
@ naught101: Die Gegenbeispiele bei einer unimodalen Verteilung sind seine nächste Zeile: Wenn der Buckel rechts ist, zieht der Schwanz links den Median unter den Mittelwert. Je länger der Schwanz ist, desto größer ist die Lücke zwischen Median und Mittelwert.
Assad Ebrahim
1
Unter welchen praktischen Umständen würde man einen Median über einem Mittelwert verwenden oder umgekehrt? Zum Beispiel sollte ich in der Überlebensanalyse, in der Lebensdauern einer Exponentialverteilung folgen, den Median (also die Hälfte der Dinge dauert länger, die Hälfte weniger) oder den Mittelwert (die "erwartete" Lebensdauer) verwenden, wenn ich Leben / Tod als Binärwert vorhersagen muss Ergebnis?
Drevicko
5

X.L.N.(μ,σ2)

  • H.M.(X.)=eμ- -12σ2
  • GM.(X.)=eμ
  • EINM.(X.)=eμ+12σ2

Es ist nicht schwer zu erkennen, dass das Produkt aus dem harmonischen und dem arithmetischen Mittel das Quadrat des geometrischen Mittels ergibt, d. H.

H.M.(X.)EINM.(X.)=GM.2(X.).

Da alle Werte positiv sind, können wir die Quadratwurzel ziehen und feststellen, dass das geometrische Mittel von H.X.X.X.

GM.(X.)=H.M.(X.)EINM.(X.).

Darüber hinaus ist die bekannte HM-GM-AM-Ungleichung

H.M.(X.)GM.(X.)EINM.(X.)

kann ausgedrückt werden als

H.M.(X.)GV.einr(X.)=GM.(X.)=EINM.(X.)GV.einr(X.),

GV.einr(X.)=eσ2

Björn Friedrich
quelle
1

Der Vollständigkeit halber gibt es auch Verteilungen, für die der Mittelwert nicht genau definiert ist. Ein klassisches Beispiel ist die Cauchy-Verteilung ( diese Antwort enthält eine schöne Erklärung, warum). Ein weiteres wichtiges Beispiel ist die Pareto-Verteilung mit einem Exponenten von weniger als 2.

drevicko
quelle
1
x=0
@ Carl gute Punkte - Ich habe die Antwort entsprechend bearbeitet. Vielen Dank (:
Drevicko
0

Während es richtig ist, dass mathematischer Mittelwert und Erwartungswert identisch definiert sind, wird diese Namenskonvention für eine verzerrte Verteilung irreführend.

Stellen Sie sich vor, Sie fragen eine Freundin nach den Immobilienpreisen in ihrer Stadt, weil Sie es dort wirklich mögen und tatsächlich darüber nachdenken, in diese Stadt zu ziehen.

Wenn die Verteilung der Immobilienpreise unimodal und symmetrisch war, kann Ihr Freund Ihnen den Durchschnittspreis der Häuser mitteilen, und Sie können tatsächlich erwarten , dass die meisten Häuser auf dem Markt um diesen Mittelwert herum liegen .

Wenn jedoch die Verteilung der Immobilienpreise unimodal und verzerrt ist, z. B. rechtsgerichtet, wobei die meisten Häuser in der unteren Preisklasse links und nur einige exorbitante Häuser rechts liegen, wird der Mittelwert auf hohe Preise "verzerrt" das Recht.

Bei dieser unimodalen, verzerrten Hauspreisverteilung erwarten Sie die meisten Häuser auf dem Markt um den Median .

Sol Hator
quelle
1
Es ist nicht klar, was Sie meinen, wenn Sie für verzerrte unimodale Verteilungen sagen, dass die Hauspreisverteilung Preise um den Median hat. Was gesagt werden kann ist, dass die Hälfte der Werte auf oder unter dem Median und die Hälfte auf oder über dem Median liegt. Es gibt nicht an, wie nahe diese Werte am Mittelwert liegen.
Michael R. Chernick
Ich nehme an, dass Ihr letzter Satz mit "Median" enden soll? Wenn ja, halte ich es für offensichtlich, dass der Median der (erreichbare) Wert sein muss, der dem Durchschnitt (der möglicherweise nicht erreichbar ist, z. B. kein Immobilienpreis) einer Zufallsstichprobe aus der oben beschriebenen Bevölkerung am nächsten kommt. Das heißt, der Median liegt im Durchschnitt dieser durchschnittlichen Stichprobe am nächsten. Wenn nicht, habe ich keinen Anspruch darauf erhoben, wie nahe diese Werte am Mittelwert liegen. Ich habe einen Anspruch auf ihre Entfernung zum Median erhoben.
Sol Hator