Eine Möglichkeit , über bedingte Darstellung zu denken ist als Projektion auf die -Algebra G .σG
( aus Wikimedia Commons )
Dies gilt konsequent für quadratisch integrierbare Zufallsvariablen. in diesem Fall ist eigentlich die orthogonale Projektion der Zufallsvariablen ξ auf den Unterraum von L 2 ( Ω ), die aus Zufallsvariablen besteht, die in Bezug auf G messbar sind . Tatsächlich stellt sich heraus, dass dies in gewissem Sinne für L 1 -Zufallsvariablen durch Annäherung an L 2 -Zufallsvariablen zutrifft .E[ξ|G]ξL2(Ω)GL1L2
(Siehe die Kommentare für Referenzen.)
Betrachtet man Algebren als Repräsentation der verfügbaren Informationen (eine Interpretation, die in der Theorie stochastischer Prozesse unabdingbar ist), so bedeuten größere σ - Algebren mehr mögliche Ereignisse und damit mehr Informationen über mögliche Ergebnisse, während kleinere σ - Algebren bedeuten weniger mögliche Ereignisse und damit weniger Informationen über mögliche Ergebnisse.σ−σ−σ−
Daher bedeutet das Projizieren der messbaren Zufallsvariablen ξ auf die kleinere σ - Algebra G, dass wir unsere beste Schätzung für den Wert von ξ treffen, wenn man die begrenzteren Informationen von G berücksichtigt .Fξσ−GξG
Mit anderen Worten, wenn nur die Informationen von und nicht die gesamten Informationen von F , E [ ξ | gegeben sind G ] ist in einem strengen Sinne unsere bestmögliche Schätzung für das, was der Zufallsvariable ξ ist.GFE[ξ|G]ξ
In Bezug auf Ihr Beispiel denke ich, dass Sie zufällige Variablen und ihre Werte verwirren könnten. Eine Zufallsvariable ist eine Funktion, deren Domäne der Ereignisraum ist. Es ist keine Zahl. Mit anderen Worten, X : Ω → R , X ∈ { f | f : & OHgr; → R } , während für ein ω ∈ & OHgr; , X ( ω ) ∈ R .XX: Ω → RX∈ { f | f : Ω → R }ω ∈ ΩX( ω ) ∈ R
Die Notation für bedingte Erwartung ist meiner Meinung nach wirklich schlecht, weil es sich um eine Zufallsvariable handelt, dh auch um eine Funktion . Die (regelmäßige) Erwartung einer Zufallsvariablen ist dagegen eine Zahl . Die bedingte Erwartung einer Zufallsvariablen ist eine völlig andere Größe als die Erwartung derselben Zufallsvariablen, dh "prüft" nicht einmal mit E [ ξ ] .E[ξ|G]E[ξ]
Mit anderen Worten, die Verwendung des Symbols , um sowohl die reguläre als auch die bedingte Erwartung zu kennzeichnen, ist ein sehr großer Missbrauch der Notation, der zu unnötiger Verwirrung führt.E
Beachten Sie, dass ist eine Zahl (der Wert der Zufallsvariablen E [ ξ | G ], die mit dem Wert ω bewertet wird ), aber E [ ξ | Ω ] ist eine Zufallsvariable, stellt sich aber als konstante Zufallsvariable heraus (dh trivial entartet), da die durch Ω , { ∅ , Ω } erzeugte σ- AlgebraE [ξ| G] ( ω )E [ξ| G]ωE [ξ|Ω]σΩ{∅,Ω}ist trivial / degeneriert, und dann ist der konstante Wert dieser konstanten Zufallsvariablen technisch gesehen , wobei E reguläre Erwartung und damit eine Zahl, nicht bedingte Erwartung und damit keine Zufallsvariable bezeichnet.E[ξ]E
Sie scheinen auch verwirrt darüber zu sein, was die Notation bedeutet; technisch ist es nur möglich, an σ - algebren zu konditionieren , nicht an einzelne ereignisse, da wahrscheinlichkeitsmaße nur an vollständigen σ - algebren definiert werden, nicht an einzelne ereignisse. Somit ist E [ ξ | A ] ist nur eine (faule) Abkürzung für E [ ξ | σ ( A ) ] , wobei σ ( A ) für σ - stehtE[ξ|A]σ−σ−E[ξ| A]E [ξ| σ( A ) ]σ( A )σ-Algebra, die durch das Ereignis erzeugt wird , das { ∅ , A , A c , Ω } ist . Man beachte , dass σ ( A ) = G = σ ( A c ) ; mit anderen Worten, E [ ξ | A ] , E [ ξ | G ] und E [ ξ | A c ] sind verschiedene Möglichkeiten, um genau dasselbe Objekt zu bezeichnen .EIN{ ∅ , A , Ac, Ω }σ( A ) = G= σ( Ac)E [ξ| A]E [ξ| G]E [ξ| EINc]
Abschließend möchte ich nur hinzufügen, dass die oben gegebene intuitive Erklärung erklärt, warum der konstante Wert der Zufallsvariablen ist nur die Zahl E [ ξ ] - die σ - Algebra { ∅ , Ω }E [ξ| Ω]= E [ξ| σ( Ω ) ] = E [ ξ|{∅,Ω}]E[ξ]σ−{∅,Ω}stellt die geringstmögliche Menge an Informationen dar, die wir haben könnten, im Grunde genommen keine Informationen. Unter diesen extremen Umständen ist die bestmögliche Schätzung, für welche Zufallsvariable die konstante Zufallsvariable ist, deren konstanter Wert E [ ξ ] ist .ξE[ξ]
Es ist zu beachten, dass alle konstanten Zufallsvariablen -Zufallsvariablen sind und alle in Bezug auf die triviale σ- Algebra { ∅ , Ω } messbar sind. Wir haben also tatsächlich die konstante Zufallsvariable E [ ξ ] als orthogonale Projektion von ξ auf den Unterraum von L 2 ( Ω ) , der aus zufälligen Variablen besteht, die in Bezug auf { ∅ , Ω } messbar sind , wie beansprucht.L2σ{∅,Ω}E[ξ]ξL2(Ω){∅,Ω}
Ich werde versuchen, das auszuarbeiten, was William vorgeschlagen hat.
Sei der Probenraum, in dem eine Münze zweimal geworfen wird. Definieren Sie den ran. var. ξ um die Nummer zu sein. von Köpfen, die im Experiment auftreten. Es ist klar, dass E [ ξ ] = 1 ist . Eine Art zu denken, was 1 , als eine Erwartung. value, represent ist die bestmögliche Schätzung für ξ . Wenn wir raten müssten, welchen Wert ξ annehmen würde, würden wir 1 annehmen . Dies liegt daran, dass E [ ( ξ - 1 ) 2 ] ≤ E [ ( ξ - a ) 2 istΩ ξ E[ ξ] = 1 1 ξ ξ 1 für jede reelle Zahl a .E[ ( ξ- 1 )2] ≤ E[ ( ξ- a )2] ein
Bezeichne mit den Fall, dass das erste Ergebnis ein Kopf ist. Sei G = { ∅ , A , A c , Ω } das σ- alg. gen. von A . Wir denken an G als Repräsentation dessen, was wir nach dem ersten Wurf wissen. Nach dem ersten Wurf traten entweder Köpfe auf oder es traten keine Köpfe auf. Wir befinden uns also entweder im Ereignis A oder A c nach dem ersten Wurf.A = { HT, HH} G= { ∅ , A , Ac, Ω } σ EIN G EIN EINc
Wenn wir im Fall sind , dann die bestmögliche Schätzung für ξ wäre E [ ξ | A ] = 1,5 , und wenn wir im Fall sind A c , dann ist die bestmögliche Schätzung für ξ wäre E [ ξ | A c ] = 0,5 .EIN ξ E[ ξ|A]=1.5 Ac ξ E[ξ|Ac]=0.5
Definieren Sie nun den ran. var. ist entweder 1,5 oder 0,5, abhängig davon, ob ω ∈ A ist oder nicht . Das lief. var. η , ist eine bessere Näherung als 1 = E [ ξ ], da E [ ( ξ - η ) 2 ] ≤ E [ ( ξ - 1 ) 2 ] ist .η(ω) 1.5 0.5 ω∈A η 1=E[ξ] E[(ξ−η)2]≤E[(ξ−1)2]
Was tut, ist die Antwort auf die Frage: Was ist die beste Schätzung von ξ nach dem ersten Wurf? Da wir die Information nach dem ersten Wurf nicht kennen, wird η von A abhängen . Sobald das Ereignis G uns offenbart ist, wird nach dem ersten Wurf der Wert von η bestimmt und liefert die bestmögliche Schätzung für ξ .η ξ η A G η ξ
Das Problem bei der Verwendung von als eigene Schätzung, dh 0 = E [ ( ξ - ξ ) 2 ] ≤ E [ ( ξ - η ) 2 ], ist wie folgt. ξ ist nach dem ersten Wurf nicht gut definiert. Angenommen, das Ergebnis des Experiments ist ω, wobei das erste Ergebnis Kopf ist. Wir befinden uns im Ereignis A , aber was ist ξ ( ω ) = ? Wir wissen nicht , von nur den ersten Wurf, dass Wert für uns eindeutig ist, und so ξξ 0=E[(ξ−ξ)2]≤E[(ξ−η)2] ξ ω A ξ(ω)=? ξ ist nicht gut definiert. Genauer gesagt, sagen wir, dass nicht G- messbar ist, dh sein Wert ist nach dem ersten Wurf nicht genau definiert. Somit ist η die bestmögliche Schätzung von ξ nach dem ersten Wurf.ξ G η ξ
Vielleicht kann sich hier jemand ein komplexeres Beispiel aus dem Abtastraum mit ξ ( ω ) = ω und G einer nicht-trivialen σ- Algebra einfallen lassen.[0,1] ξ(ω)=ω G σ
quelle
Sie fordern zwar auf, die formale Definition nicht zu verwenden, aber ich denke, dass die formale Definition wahrscheinlich die beste Art ist, sie zu erklären.
Wikipedia - bedingte Erwartung :
Erstens ist es eine messbare Funktion. Zweitens muss es die Erwartung über jede messbare (Unter-) Menge in H erfüllen . Also für ein Ereignis, A, der Sigma - Algebra ist { A , A C , ∅ , Ω } , so klar wird eingestellt , wie Sie in Ihrer Frage angegeben für & ohgr; & egr ; A / A c . In ähnlicher Weise listen wir für jede diskrete Zufallsvariable (und Kombinationen davon) alle primitiven Ereignisse auf und ordnen die Erwartung für dieses primitive Ereignis zu.H H {A,AC,∅,Ω} ω∈A/Ac
Betrachten wir nun eine Münze eine unendliche Anzahl von Zeiten zu werfen, wo ich bei jedem Wurf, erhalten Sie , wenn Ihre Münze Schwänze dann Ihre gesamten Gewinne ist sind X = & Sgr; ∞ i = 1 11/2i wobeici= 1 für Schwänze und 0 für Köpfe. Dann ist X eine echte Zufallsvariable für[0,1]. Nach n Münzwürfen, weiß man den Wert von X zu Genauigkeit1/2n,Beispiel nach 2 Münze wirft es in [0,1 / 4], [1 / 4,1 / 2], [1 / 2,3 / 4] oder [3 / 4,1] - Nach jedem Münzwurf wird Ihre Sigma-Algebra immer feiner und die bedingte Erwartung von X wird immer präziser.X=∑∞i=112ici ci [0,1] 1/2n
Hoffentlich entfernt Sie dieses Beispiel einer Zufallsvariablen mit einem reellen Wert und einer Folge von Sigma-Algebren, die immer feiner werden (Filtration), von der rein ereignisbasierten Intuition, die Sie gewohnt sind, und verdeutlicht deren Zweck.
quelle