Erwarteter Wert vs. wahrscheinlichster Wert (Modus)

15

Der Erwartungswert einer Verteilung f(x) ist der Mittelwert, das heißt der gewichtete Mittelwert

E[x]=+xf(x)dx

Der wahrscheinlichste Wert ist der Modus, dh der wahrscheinlichste Wert.

Erwarten wir jedoch, dass wir E[x] oft sehen werden? Zitat von hier :

Wenn die Ergebnisse nicht gleich wahrscheinlich sind, muss der einfache Durchschnitt durch den gewichteten Durchschnitt ersetzt werden, was die Tatsache berücksichtigt, dass einige Ergebnisse wahrscheinlicher sind als die anderen. Die Intuition bleibt jedoch dieselbe: Der erwartete Wert von ist das, was man im Durchschnitt erwartet .xxix

Ich kann nicht verstehen, was "durchschnittlich passieren" bedeutet. Bedeutet dies, dass ich aus heutiger Sicht sehr viel Zeit nehme, um E[x] mehr zu sehen als andere Werte von x ? Aber ist das nicht die Definition von Mode?

Wie ist die Aussage zu interpretieren? Und was ist die probabilistische Bedeutung von E[x] ?


Ich möchte auch ein Beispiel zeigen, bei dem ich verwirrt bin. Studieren Verteilung erfuhr ich , dass der Modus ist χ 2 m o d e = ν - 2 , während E [ χ 2 ] = ν , wobei ν die Freiheitsgrade der Daten sind.χ2χmode2=ν2E[χ2]=νν

Ich an der Universität gehört , dass, wenn ein tun nach der Verwendung von Methode der kleinsten Quadrate Test eine Reihe von Daten zu passen, sollte ich bekommen erwarten χ 2 & ap ; & ngr; denn „das ist , was in der Regel geschieht“.χ2χ2ν


Habe ich das alles falsch verstanden oder ist der erwartete Wert irgendwie sehr wahrscheinlich? (Auch wenn der meisten wahrscheinliche Wert ist natürlich der Modus)

Sørën
quelle
4
Ich mag die Macht der Ticket-in-a-Box-Metapher für diese Frage wirklich , weil sie eine einfache, klare Antwort liefert: Die Erwartung einer Zufallsvariablen ist die Summe ihrer Werte (wie auf den Tickets gezeichnet) geteilt durch die Anzahl der Tickets. Das ist es. Jede Aussage, die nicht aus dieser Definition (oder höher entwickelten mathematischen Äquivalenten davon) folgt, ist nur eine Heuristik und kann unter bestimmten Umständen sehr wahrscheinlich falsch sein.
Whuber

Antworten:

18

Bei einer Normalverteilung entspricht der erwartete Wert, auch Mittelwert genannt, dem Modus.

Im Allgemeinen ist nicht nur der erwartete Wert nicht nur der wahrscheinlichste (oder der mit der höchsten Dichte), sondern es besteht möglicherweise auch keine Chance, dass er auftritt. Betrachten Sie beispielsweise die Zufallsvariable X, die 0 oder 2 mit einer Wahrscheinlichkeit von jeweils 0,5 entspricht. Dann ist EX = 1, aber der erwartete Wert 1 hat eine Eintrittswahrscheinlichkeit von 0, während 0 und 2 beide Verteilungsmoden sind.

Das Zitat "Der erwartete Wert von x ist das, was man im Durchschnitt erwartet" ist eine nicht-technische Laiensprache, die, wie Sie an Ihrer Verwirrung erkennen, nur dazu dient, die Dinge zu verwirren. Der erwartete Wert hat in Bezug auf die Wahrscheinlichkeit eine ganz bestimmte Bedeutung als mathematischer Durchschnitt. Während in der Sprache des Laien ein erwarteter Wert oder "im Durchschnitt" etwas sein kann, von dem erwartet wird, dass es typisch ist. Diese können in Einklang gebracht werden, wenn "im Durchschnitt" als der mathematische Durchschnitt dessen interpretiert wird, was auftritt.

Mit freundlichen Grüßen

Joe Average

Mark L. Stone
quelle
1
Es stellt sich die Frage: Was ist mit dem Median, der garantiert möglich ist ?
Bright-Star
Wie @ TrevorAlexander sagte, gibt Mode auch keine Garantien. Betrachten Sie die Art der kontinuierlichen Verteilung.
Tim
3
@ Trevor Alexander Es gibt immer einen Median, der möglich ist (positive Wahrscheinlichkeit oder Dichte). Es sind jedoch nicht unbedingt alle Mediane möglich. Ein Median des Zufallsvariablen X ist ein beliebiger Punkt m für die und P ( X m ) 1 / 2 . Wenn X gleich 1,2,3 oder 4 ist, jeweils mit einer Wahrscheinlichkeit von 1/4, dann ist jede Zahl im Intervall [2,3] ein Median von X.P(Xm)1/2P(Xm)1/2
Mark L. Stone
5

Der erwartete Wert ist a priori sehr abstrakt und es gibt keinen Grund zu der Annahme, dass dies das wahrscheinlichste Ergebnis ist. Wie andere hervorheben, ist es einfach, Zufallsvariablen zu konstruieren, für die (und dasselbe mit der Dichte, wenn X stetig ist).

P(X=E(X))=0
X

Die einzige Rechtfertigung für den erwarteten Wert und der Grund, warum wir "erwarten, ihn oft zu sehen", ist das Gesetz der großen Zahlen :

wenn du n hastn unabhängige, identisch verteilte Variablen , dannXi

X1++XnnE(X)

(für eine passende Bedeutung von die im Moment nicht untersucht werden sollte)

Was bedeutet es? Stellen Sie sich vor, Sie werfen eine Münze mit der Wahrscheinlichkeit des Landekopfes, den wir der Zahl1zuordnen, und Wahrscheinlichkeit1-pdes Landeschwanzes (dh0). Was ist das wahrscheinlichste Ergebnis? 1! (das heißt, Kopf) Was ist der erwartete Wert? E(X)=1p+0(1-p)=pp>1211p0

E(X)=1p+0(1p)=p

Es ist klar, dass "p" niemals vorkommen wird (entweder Kopf oder Schwanz, entweder 0 oder 1).

E(X)=p

Ameise
quelle
Ich würde nicht sagen, dass das Gesetz der großen Zahlen die einzige Rechtfertigung für den erwarteten Wert ist. Zum Beispiel ist en.wikipedia.org/wiki/… eine Rechtfertigung für die Berücksichtigung der erwarteten Werte von Utility-Funktionen (ich habe den Beweis nicht studiert, bin aber überrascht, wenn er irgendwie auf dem Gesetz großer Zahlen basiert).
Juho Kokkala
3

Ich mag den Begriff "Erwartungswert" nicht und habe ihn beim Unterrichten der Wahrscheinlichkeit nicht verwendet. "Arithmetischer Mittelwert" ist meiner Meinung nach besser, da der arithmetische Mittelwert eines 6-seitigen Würfels 3,5 beträgt, eine solche Zahl jedoch nicht vorkommt. Ich habe ursprünglich im College den Begriff "Erwartungswert" für das Konzept gehört. Viele Fachbegriffe stimmen nicht mit der offensichtlichen nichttechnischen Bedeutung überein. ("Oder" fällt mir ein.)

Beachten Sie, dass eine Verteilung mehrere Modi haben kann, das arithmetische Mittel jedoch eindeutig ist. Modus, Mittelwert und Median sind unterschiedlich und werden unterschiedlich verwendet.

ttw
quelle
1
Schön auf dem "oder". Das ließ mich an meinen Kurs in Linearer Programmierung denken, in dem wir verschiedene Theoreme der Alternative studierten. Sie hatten die Form "Entweder A ist wahr oder B ist wahr, aber nicht beide". Es ist viel einfacher, es als A oder B auszudrücken. Ich höre nicht viel Gebrauch von X oder in ungezwungenen Straßengesprächen.
Mark L. Stone
2

Der Unterschied ist bei diskreten Verteilungen am einfachsten zu erkennen:

Betrachten Sie zwei Wertesätze, bei denen jede Zahl mit gleicher Wahrscheinlichkeit gezogen wird: {1,2,2,2,10} und {1,2,2,2,3}.

Beide haben den gleichen Modus (2), aber die erwarteten Werte unterscheiden sich. Bei einem erwarteten Wert werden große Werte zusätzlich gewichtet, während der Modus lediglich nach dem Wert sucht, der häufig auftritt. Wenn Sie also ein paarmal aus dieser Verteilung gezogen hätten, wäre Ihr Stichprobenmittelwert in der Nähe des erwarteten Werts, während die am häufigsten auftretende Ganzzahl in der Nähe des Modus liegt.

Der Modus ist definiert als mÖde=einrGmaxf(x) während, wie Sie oben gezeigt haben, der erwartete Wert überintegriert wird xf(x) so berücksichtigt es das Gewicht von jedem x.

Die Verwendung der Sprache zur Unterscheidung zwischen verschiedenen Maßstäben der zentralen Tendenz ist ein häufiges Problem beim Erlernen von Statistiken. Beispielsweise ist der Median ein weiteres Maß, das nicht durch große Werte wie den Durchschnitt verzerrt wird.

VCG
quelle