Warum entspricht die Erwartung dem arithmetischen Mittel?

47

Heute bin ich auf ein neues Thema gestoßen, das sich Mathematische Erwartung nennt. Das Buch, dem ich folge, besagt, dass Erwartung das arithmetische Mittel einer Zufallsvariablen ist, die aus einer Wahrscheinlichkeitsverteilung stammt. Aber es definiert Erwartung als die Summe des Produkts einiger Daten und deren Wahrscheinlichkeit. Wie können diese beiden (Durchschnitt und Erwartung) gleich sein? Wie kann die Summe aus Wahrscheinlichkeit und Daten der Durchschnitt der gesamten Verteilung sein?

Pranphy
quelle

Antworten:

51

Informell definiert eine Wahrscheinlichkeitsverteilung die relative Häufigkeit der Ergebnisse einer Zufallsvariablen - der erwartete Wert kann als gewichteter Durchschnitt dieser Ergebnisse (gewichtet mit der relativen Häufigkeit) betrachtet werden. In ähnlicher Weise kann der erwartete Wert als arithmetisches Mittel einer Menge von Zahlen angesehen werden, die genau proportional zu ihrer Eintrittswahrscheinlichkeit generiert wurden (im Fall einer kontinuierlichen Zufallsvariablen ist dies nicht genau der Fall, da bestimmte Werte die Wahrscheinlichkeit ).0

Der Zusammenhang zwischen dem erwarteten Wert und dem arithmetischen Mittelwert ist am deutlichsten bei einer diskreten Zufallsvariablen, bei der der erwartete Wert ist

E(X)=SxP(X=x)

wobei der Probenraum ist. Angenommen, Sie haben eine diskrete Zufallsvariable so dass:SX

X={1with probability 1/82with probability 3/83with probability 1/2

Das heißt, die Wahrscheinlichkeitsmassenfunktion ist , und . Unter Verwendung der obigen Formel ist der erwartete WertP(X=1)=1/8P(X=2)=3/8P(X=3)=1/2

E(X)=1(1/8)+2(3/8)+3(1/2)=2.375

Betrachten Sie nun Zahlen, die mit Frequenzen generiert wurden, die genau proportional zur Wahrscheinlichkeitsmassenfunktion sind - zum Beispiel die Menge der Zahlen - zwei s, sechs s und acht s. Nimm nun das arithmetische Mittel dieser Zahlen:{1,1,2,2,2,2,2,2,3,3,3,3,3,3,3,3}123

1+1+2+2+2+2+2+2+3+3+3+3+3+3+3+316=2.375

und Sie können sehen, dass es genau dem erwarteten Wert entspricht.

Makro
quelle
Wäre dies nicht besser mit der einfacheren Menge von {1,2,2,2,3,3,3,3} zu veranschaulichen? Der Ausdruck, der das arithmetische Mittel dieser Menge angibt, ist identisch mit dem Ausdruck, der den Erwartungswert dieser Variablen angibt (wenn Sie die gewichteten Produkte in einfache Summen umwandeln).
Dancrumb
Betreff: "Der Ausdruck, der das arithmetische Mittel dieser Menge angibt, ist identisch mit dem Ausdruck, der den Erwartungswert dieser Variablen angibt (wenn Sie die gewichteten Produkte in einfache Summen umwandeln)." - Ja @Dancrumb, das war der ganze Punkt :)
Macro
12

Die Erwartung ist der Durchschnittswert oder der Mittelwert einer Zufallsvariablen und keine Wahrscheinlichkeitsverteilung. Für diskrete Zufallsvariablen ist dies der gewichtete Durchschnitt der Werte, die die Zufallsvariable annimmt, wobei die Gewichtung gemäß der relativen Häufigkeit des Auftretens dieser einzelnen Werte erfolgt. Für eine absolut kontinuierliche Zufallsvariable ist es das Integral der Werte x multipliziert mit der Wahrscheinlichkeitsdichte. Beobachtete Daten können als Werte einer Sammlung unabhängiger, identisch verteilter Zufallsvariablen betrachtet werden. Der Stichprobenmittelwert (oder die Stichprobenerwartung) ist definiert als die Erwartung der Daten in Bezug auf die empirische Verteilung für die beobachteten Daten. Dies macht es einfach zum arithmetischen Durchschnitt der Daten.

Michael Chernick
quelle
2
+1. Guter Fang zu: "Die Erwartung ist der Durchschnittswert oder der Mittelwert einer Zufallsvariablen, nicht eine Wahrscheinlichkeitsverteilung." Ich habe diesen subtilen Missbrauch der Terminologie nicht bemerkt.
Makro
4

Lasst uns die Definitionen genau betrachten:

Mittelwert ist definiert als die Summe einer Sammlung von Zahlen geteilt durch die Anzahl der Zahlen in der Sammlung. Die Berechnung wäre "für i in 1 bis n (Summe von x sub i) geteilt durch n".

Der Erwartungswert (EV) ist der langfristige Durchschnittswert der Wiederholungen des Experiments, das er darstellt. Die Berechnung wäre "für i in 1 bis n die Summe des Ereignisses x sub i multipliziert mit seiner Wahrscheinlichkeit (und die Summe aller p sub i muss = 1 sein)."

Im Falle eines fairen Würfels ist es leicht zu erkennen, dass der Mittelwert und der EV gleich sind. Mittelwert - (1 + 2 + 3 + 4 + 5 + 6) / 6 - 3,5 und EV wären:

prob xp * x

0,167 1 0,17

0,167 2 0,33

0,167 3 0,50

0,167 4 0,67

0,167 5 0,83

0,167 6 1,00

EV = Summe (p * x) = 3,50

Aber was wäre, wenn der Würfel nicht "fair" wäre? Eine einfache Möglichkeit, einen unfairen Würfel herzustellen, besteht darin, ein Loch in die Ecke am Schnittpunkt der Flächen 4, 5 und 6 zu bohren. Nehmen wir weiter an, dass die Wahrscheinlichkeit, eine 4, 5 oder 6 auf unserem neuen und verbesserten krummen Würfel zu würfeln, jetzt 0,2 und die Wahrscheinlichkeit, eine 1, 2 oder 3 zu würfeln, jetzt 0,13 beträgt. Es ist der gleiche Würfel mit 6 Flächen, einer Zahl auf jeder Fläche und der Mittelwert für diesen Würfel beträgt immer noch 3,5. Nachdem wir diesen Würfel viele Male gewürfelt haben, beträgt unser EV nun 3,8, da die Wahrscheinlichkeiten für die Ereignisse nicht mehr für alle Ereignisse gleich sind.

prob xp * x

0,133 1 0,13

0,133 2 0,27

0,133 3 0,40

0,200 4 0,80

0,200 5 1,00

0,200 6 1,20

EV = Summe (p * x) = 3,80

Lassen Sie uns noch einmal vorsichtig sein und zur Definition zurückkehren, bevor wir zu dem Schluss kommen, dass eine Sache immer "dieselbe" sein wird wie eine andere. Schauen Sie sich an, wie ein normaler Würfel aufgebaut ist, bohren Sie ein Loch in die anderen 7 Ecken und sehen Sie, wie sich die EVs ändern - viel Spaß.

Bob_T

Bob_T
quelle
-1

Der einzige Unterschied zwischen "Mittelwert" und "Erwartungswert" besteht darin, dass der Mittelwert hauptsächlich für die Häufigkeitsverteilung und die Erwartungsverteilung für die Wahrscheinlichkeitsverteilung verwendet wird. In der Häufigkeitsverteilung besteht der Probenraum aus Variablen und ihren Auftrittshäufigkeiten. Bei der Wahrscheinlichkeitsverteilung besteht der Stichprobenraum aus Zufallsvariablen und ihren Wahrscheinlichkeiten. Jetzt wissen wir, dass die Gesamtwahrscheinlichkeit aller Variablen im Probenraum = 1 sein muss. Hier liegt der grundlegende Unterschied. Der Nenner für die Erwartung ist immer = 1. (dh Summation f (xi) = 1) Es gibt jedoch keine derartigen Einschränkungen für die Summation der Häufigkeit (was im Grunde die Gesamtzahl der Einträge ist).

Shruti
quelle