Was ist im Allgemeinen der Unterschied zwischen und ?
Ist früher die Funktion von und letztere die Funktion von ? Es ist so verwirrend ..
Was ist im Allgemeinen der Unterschied zwischen und ?
Ist früher die Funktion von und letztere die Funktion von ? Es ist so verwirrend ..
Antworten:
Grob gesagt besteht der Unterschied zwischen und darin, dass die erstere eine Zufallsvariable ist, während die letztere (in gewissem Sinne) eine Realisierung von . Wenn zum Beispiel dann ist die Zufallsvariable Umgekehrt , wenn beobachtet wird, würden wir eher in der Menge interessiert werden die ist ein Skalar.E(X∣Y) E(X∣Y=y) E(X∣Y)
Vielleicht scheint dies eine unnötige Komplikation zu sein, aber als eigenständige Zufallsvariable zu betrachten, macht Dinge wie das Turmgesetz sinnvoll - Das Ding an der Innenseite der Klammern ist zufällig, also können wir fragen, wie es erwartet wird, wohingegen nichts Zufälliges ist . In den meisten Fällen könnten wir hoffen, zu berechnen E ( X ) = E [ E ( X ≤ Y ) ] E ( X ≤ Y = y ) E ( X ≤ Y = y ) = ≤ x f X ≤ Y ( x ≤ y ) d xE( X∣ Y) E( X) = E[ E( X∣ Y) ] E( X∣ Y= y)
und dann erhalte durch "Einfügen" der Zufallsvariablen anstelle von in den resultierenden Ausdruck. Wie in einem früheren Kommentar angedeutet, gibt es ein bisschen Subtilität, die sich einschleichen kann, wenn es darum geht, wie diese Dinge genau definiert und in geeigneter Weise miteinander verknüpft werden. Dies geschieht aufgrund einiger technischer Probleme mit der zugrunde liegenden Theorie mit bedingter Wahrscheinlichkeit.Y yE( X∣ Y) Y. y
quelle
Angenommen, und sind Zufallsvariablen.X Y.
Sei eine feste reelle Zahl, sagen wir . Dann ist eine Zahl : es ist der bedingte erwartete Wert von vorausgesetzt, dass den Wert . Beachten Sie nun für eine andere feste reelle Zahl , dass , der bedingte erwartete Wert von bei (ein reeller Wert) Nummer). Es gibt keinen Grund anzunehmen, dass undy0 y 0 = 1 E [ X | Y = y 0 ] = E [ X | Y = 1 ] X Y 1 y 1 y 1 = 1,5 E [ X | Y = y 1 ] = E [ X | Y = 1,5 ] X Y = 1,5 E [ X ∣ Y =y0= 1 E[ X∣ Y= y0]=E[X∣Y=1] X Y 1 y1 y1=1.5 E[X∣Y=y1]=E[X∣Y= 1,5 ] X Y= 1,5 E[X∣Y= 1,5 ] E[X∣Y= 1 ] E [ X | Y = y ] g ( y ) y E [ X | Y = y ] E [ X | Y = y ] x E [ X | Y = y ] yhaben den gleichen Wert. Wir können also auch als eine reelle Funktion
, die reelle Zahlen auf reelle Zahlen abbildet . Beachten Sie, dass die Aussage in der Frage des OP, dass eine Funktion von
ist, falsch ist: ist eine reelle Funktion von .E[ X∣ Y= y] G( y) y E[ X∣ Y= y] E[ X∣ Y= y] x E[ X∣ Y= y] y
Andererseits ist eine Zufallsvariable die zufällig eine Funktion der Zufallsvariablen . Wenn wir nun schreiben , meinen wir, dass die Zufallsvariable immer dann den Wert hat , wenn die Zufallsvariable zufällig den Wert hat . Immer wenn den Wert annimmt , nimmt die Zufallsvariable den Wert . Somit ist nur ein anderer Name für die ZufallsvariableE[ X∣ Y] Z Y Z = h ( Y ) Y y Z h ( y ) Y Y Z = E [ X | Y ] E [ X | Y = y ] = g ( y ) E [ X | Y ] Z = g ( Y ) E [ X ∣ Y Z Y. Z= h ( Y) Y. y Z h ( y) Y. y
Z= E[ X∣ Y] E[ X∣ Y= y] = g( y) E[ X∣ Y] Z= g( Y) . Beachten Sie, dass eine Funktion von
(nicht wie in der Aussage der OP-Frage).E[ X∣ Y] Y. y
Als einfaches anschauliches Beispiel sei angenommen, dass und diskrete Zufallsvariablen mit gemeinsamer Verteilung Beachten Sie, dass und (abhängige) Bernoulli- Zufallsvariablen mit den Parametern bzw. sind und somit und . Nun beachten Sie , dass bedingt auf , ist ein Bernoulli - Zufallsvariable mit Parametern , während konditionierteX Y. P( X= 0 , Y= 0 )P( X= 1 , Y= 0 )= 0,1 , P ( X= 0 , Y= 1 ) = 0,2 ,= 0,3 , P ( X= 1 , Y= 1 ) = 0,4. X Y. 0,70,6E[X]=0,7E[Y]=0,6Y=0X0,75Y=1X20,7 0,6 E[ X] = 0,7 E[ Y] = 0,6 Y.= 0 X 0,75 bei ist eine Bernoulli-Zufallsvariable mit dem Parameter . Wenn Sie nicht erkennen können, warum dies so ist, müssen Sie nur die Details herausfinden: Zum Beispiel
und in ähnlicher Weise für und . Wir haben also
Somit ist wobei eine reelle Funktion mit folgenden Eigenschaften ist:Y.= 1 X 23 P( X=1∣Y=0)=P(X=1,Y=0)P(Y=0)=0.30.4=34,P(X=0∣Y=0)=P(X=0,Y=0)P(Y=0)=0.10.4=14, P( X= 1 ≤ Y= 1 ) P( X= 0 ≤ Y= 1 ) E[ X∣ Y= 0 ] = 34,E[ X∣ Y= 1 ] = 23. E[ X∣ Y= y] = g( y) G( y) G( 0 ) = 34,G( 1 ) = 23.
Andererseits ist eine Zufallsvariable, die die Werte und mit den Wahrscheinlichkeiten und annimmt bzw.. Beachten Sie, dass eine diskrete Zufallsvariable ist, aber keine Bernoulli-Zufallsvariable.E[ X∣ Y] = g( Y) 334 23 0,4 = P( Y= 0 ) 0,6 = P( Y= 1 ) E[ X∣ Y]
Zum Schluss sei angemerkt, dass Das heißt, der erwartete Wert dieser Funktion von , den wir nur unter Verwendung der Randverteilung von berechnet haben, hat zufällig den gleichen numerischen Wert wie !! Dies ist eine Illustration eines allgemeineren Ergebnisses, das viele Leute für eine LÜGE halten:E[ Z] = E[ E[ X∣ Y] ] = E[ g( Y)]=0.4×34+0.6×23=0.7=E[X]. YYE[X]E[E[X∣Y]]=E[X].Y. Y. E[ X] E[ E[ X∣ Y] ] = E[ X] .
Sorry, das ist nur ein kleiner Scherz. LIE ist eine Abkürzung für Law of Iterated Expectation (Gesetz der wiederholten Erwartung). Dies ist ein völlig gültiges Ergebnis, von dem jeder glaubt, dass es die Wahrheit ist.
quelle
X Y E ( X | Y = y ) X Y = yE(X|Y) ist die Erwartung einer Zufallsvariablen: die Erwartung von , die von abhängig ist .
ist andererseits ein bestimmter Wert: der erwartete Wert von wenn .X Y E(X|Y=y) X Y=y
Stellen Sie sich das so vor: Lassen Sie die Kalorienaufnahme und die Körpergröße darstellen. ist dann die von der Körpergröße abhängige Kalorienaufnahme - und in diesem Fall ist unsere beste Schätzung der Kalorienaufnahme ( ), wenn eine Person eine bestimmte Körpergröße sagen wir mal 180 Zentimeter.X Y E(X|Y) E(X|Y=y) X Y=y
quelle
ist der erwartete Wert von Werten von X bei gegebenen Werten von Y E ( X | Y = y ) ist der erwartete Wert von X bei gegebenen Werten von Y ist yE(X|Y) X Y
E(X|Y=y) X Y y
Im Allgemeinen ist Wahrscheinlichkeit von Werten X angegebenen Werte Y , aber man kann genauer und sagen P ( X = x | Y = y ) , dh Wahrscheinlichkeit Wert x von allen X 's angesichts der y -te Wert von Y 's. Der Unterschied besteht darin, dass es sich im ersten Fall um "Werte von" handelt und im zweiten um einen bestimmten Wert.P(X|Y) X Y P(X=x|Y=y) x X y Y
Das folgende Diagramm ist hilfreich.
quelle