Warum werden Zufallsvariablen als Funktionen definiert?

21

Ich habe Probleme, das Konzept einer Zufallsvariablen als Funktion zu verstehen. Ich verstehe die Mechanik (glaube ich), aber ich verstehe die Motivation nicht ...

Say ist eine Wahrscheinlichkeit , triple, wobei , die Borel- ist -Algebra auf diesem Intervall und ist die regelmäßige Lebesguemaß. Sei eine Zufallsvariable von bis so dass , , ..., , also hat eine diskrete Gleichverteilung auf den Werten 1 bis 6. Ω = [ 0 , 1 ] B σ P X B { 1 , 2 , 3 , 4 , 5 , 6 } X ( [ 0 , 1 / 6 ) ) = 1 X ( [ 1 / 6 , 2 / 6 ) ) = 2 X ( [(Ω,B,P)Ω=[0,1]BσPXB{1,2,3,4,5,6}X([0,1/6))=1X([1/6,2/6))=2XX([5/6,1])=6X

Das ist alles gut, aber ich verstehe die Notwendigkeit des ursprünglichen Wahrscheinlichkeitsdreifachs nicht ... wir hätten direkt etwas Äquivalentes konstruieren können wie wobei ist die passende des Raums, und ist eine Kennzahl, die jeder Teilmenge die Kennzahl ( der Elemente) / 6 zuweist. Auch die Wahl von war willkürlich - es hätte oder eine andere Menge sein können.S σ P x Ω = [ 0 , 1 ] [ 0 , 2 ]({1,2,3,4,5,6},S,Px)SσPxΩ=[0,1][0,2]

Meine Frage ist also, warum man sich die Mühe macht, ein beliebiges mit einer Algebra und einer Kennzahl zu konstruieren und eine Zufallsvariable als Map von der Algebra bis zur realen Linie zu definieren. σ σΩσσ

Leo Vasquez
quelle
5
Beachten Sie, dass die Zufallsvariable die Funktion von nach und nicht von nach . Voraussetzung ist, dass die Zufallsvariable in Bezug auf messbar ist . R B R BΩRBRB
mpiktas

Antworten:

21

Wenn Sie sich fragen, warum all diese Maschinen verwendet werden, wenn etwas viel Einfacheres ausreichen könnte, dann haben Sie für die meisten Situationen Recht. Die maßtheoretische Version der Wahrscheinlichkeit wurde jedoch von Kolmogorov entwickelt, um eine Theorie einer solchen Allgemeinheit zu etablieren, dass sie in einigen Fällen sehr abstrakte und komplizierte Wahrscheinlichkeitsräume handhaben kann. Tatsächlich ermöglichten Kolmogorovs messtheoretische Grundlagen für die Wahrscheinlichkeit, dass probabilistische Werkzeuge weit über ihren ursprünglich vorgesehenen Anwendungsbereich hinaus auf Bereiche wie die Harmonische Analyse angewendet werden konnten.

Zunächst erscheint es einfacher, "zugrunde liegende" -algebra zu überspringen und den Ereignissen, die den Abtastraum umfassen, einfach Wahrscheinlichkeitsmassen zuzuweisen, wie Sie vorgeschlagen haben. Tatsächlich tun Probabilisten das Gleiche, wenn sie sich dazu entschließen, mit dem "induzierten Maß" in dem durch definierten Probenraum zu arbeiten . Es wird jedoch schwierig, wenn Sie in unendliche dimensionale Räume vordringen. Angenommen, Sie möchten das starke Gesetz der großen Zahlen für den speziellen Fall des Umwerfens fairer Münzen beweisen (dh, dass der Anteil der Köpfe beliebig nahe bei 1/2 liegt, wenn die Anzahl der Münzwürfe gegen unendlich geht). Sie könnten versuchen, ein zu konstruierenΩ P X - 1 σ ( H , T , H , . . . ) Ω = [ 0 , 1 ) 0,10100 ...σΩPX1σ-algebra auf der Menge der unendlichen Folgen der Form . Aber hier kann man feststellen, dass es viel bequemer ist, den zugrunde liegenden Raum auf ; und verwenden Sie dann die binären Darstellungen von reellen Zahlen (z. B. ), um Folgen von Münzwürfen darzustellen (1 ist Kopf, 0 ist Zahl ). Eine Veranschaulichung dieses Beispiels finden Sie in den ersten Kapiteln von Billingsley's Probability and Messen .(H,T,H,...)Ω=[0,1)0.10100...

charles.y.zheng
quelle
Vielen Dank! Ich werde das Buch überprüfen. Da jedoch das in Ihrem Beispiel immer noch willkürlich ist (es könnte genauso gut , ist das Einheitsintervall oder der 'bevorzugte' Raum, der in allen Fällen funktioniert Umstände? Oder gibt es Situationen, in denen ein komplizierteres wie Vorteil wäre? [ 0 , 2 ) [ 0 , 1 ] [ 0 , 1 ) Ω R 2Ω[0,2)[0,1][0,1)ΩR2
Leo Vasquez
2
@Leo: Ja. Ein Beispiel sind zeitkontinuierliche stochastische Prozesse. Das kanonische Beispiel ist die Brownsche Bewegung, bei der der Abtastraum als , der Raum aller stetigen reellen Funktionen. CΩC
Kardinal
1
@NRH, Ja, ich hätte sagen sollen, dass genommen werden kann, anstatt genommen zu werden . Ich habe (etwas absichtlich) versucht, das unter den Teppich zu bürsten.
Kardinal
1
@ Kardinal, in @ Leos Kommentar wurde gefragt, ob allen Umständen 'bevorzugt' ist. Ich sage nur, dass es bei IMO kein solches Ω gibt und dass es vorteilhaft ist, im Allgemeinen nichts über Ω zu verlangen . Wenn Sie mit einem bestimmten Beispiel arbeiten möchten, kann es Gründe geben, ein bestimmtes Ω zu wählen . Es ist jedoch zu beachten, dass die 'Tautologie' dahintersteckt, dass die Existenz der Brownschen Bewegung als Wahrscheinlichkeitsmaß für C festgestellt werden muss. [0,1]ΩΩΩC
NRH
2
@ NRH, Entschuldigung für meine Langsamkeit heute. Ich konnte den bevorzugten Verweis nicht mit @ Leos vorherigem Kommentar verknüpfen. Vielen Dank. In Bezug auf die "Tautologie" -Anmerkung war mein Punkt, dass in anderen Konstruktionen die Kontinuität von Abtastpfaden ein Theorem ist , während sie bei der basierten Konstruktion mit Identitätskarte tautologisch ist. Natürlich muss zuerst gezeigt werden, dass BM auf diese Weise konstruiert werden kann. Aber das ist ein bisschen nebensächlich. C
Kardinal
10

Die Probleme in Bezug auf Algebren sind mathematische Feinheiten, die nicht wirklich erklären, warum oder ob wir einen Hintergrundraum benötigen . In der Tat würde ich sagen, dass es keinen zwingenden Beweis dafür gibt, dass der Hintergrundraum eine Notwendigkeit ist. Für jeden probabilistischen Aufbau ( E , E , μ ), bei dem E der Probenraum ist, E die σ- Algebra und μ ein Wahrscheinlichkeitsmaß, ist das Interesse in μ , und es gibt keinen abstrakten Grund dafür, dass μ das Bildmaß sein soll einer messbaren Abbildung X : ( Ω , Bσ(E,E,μ)EEσμμμ .X:(Ω,B)(E,E)

Die Verwendung eines abstrakten Hintergrundraums bietet jedoch mathematischen Komfort , der viele Ergebnisse natürlicher und intuitiver erscheinen lässt. Das Ziel ist immer, etwas über , die Verteilung von X , zu sagen , aber es kann einfacher und klarer ausgedrückt werden, wenn man es mit X bezeichnet .μXX

Ein Beispiel liefert der zentrale Grenzwertsatz. Wenn ein reeller Wert mit dem Mittelwert μ und der Varianz σ 2 ist, sagt die CLT, dass P ( X1,,Xnμσ2 wobeiΦdie Verteilungsfunktion für die Standardnormalverteilung ist. Wenn die Verteilung vonXiμist, lautetdas entsprechende Ergebnis in Bezug auf das Maß ρ

P(nσ(1ni=1nXiξ)x)Φ(x)
ΦXiμ Eine Erklärung der Terminologie benötigt wirddurch.μ*nwir den Mittelwertn-mal Faltung vonμ(die Verteilung der Summe) Die Funktionenρcsind die linearen Funktionenρc(x)=cxund
ρn/στξρ1/n(μn)((,x])Φ(x)
μnnμρcρc(x)=cx ist die Übersetzung τ ξ ( x ) = x - ξ . Man könnte sich wahrscheinlich an die zweite Formulierung gewöhnen, aber es macht einen guten Job darin, zu verbergen, worum es geht.τξτξ(x)=xξ

Was das Problem zu sein scheint, ist, dass die mit der CLT verbundenen arithmetischen Transformationen in Form von Zufallsvariablen ziemlich klar ausgedrückt werden, sich jedoch hinsichtlich der Maße nicht so gut übersetzen lassen.

NRH
quelle
(+1) Gute Beschreibung. Ich denke, der andere Grund, warum die frühere Notation so beliebt ist, ist, dass sie sich natürlicher in intuitiven Begriffen in Anwendungen umsetzt. (Vor einigen Stunden abgestimmt.)
Kardinal
@ Cardinal, vielen Dank, dass Sie diesen Punkt klarer formuliert haben. Es erscheint natürlicher, in einer Summe von Variablen zu denken und zu argumentieren, nicht in einer Faltung von Wahrscheinlichkeitsmaßen, und wir möchten, dass die Mathematik dies widerspiegelt.
NRH
0

Ich bin erst kürzlich über diese neue Art gestolpert, sowohl über die Zufallsvariable als auch über den Hintergrundraum Ω nachzudenken . Ich bin mir nicht sicher, ob dies die Frage ist, nach der Sie gesucht haben, da dies kein mathematischer Grund ist, aber ich denke, es bietet eine sehr gute Möglichkeit, an Wohnmobile zu denken.XΩ

Stellen Sie sich eine Situation vor, in der wir eine Münze werfen. Dieser Versuchsaufbau besteht aus einer Reihe möglicher Anfangsbedingungen, einschließlich der physikalischen Beschreibung, wie die Münze geworfen wird. Der Hintergrundraum besteht aus allen möglichen Anfangsbedingungen. Der Einfachheit halber könnten wir annehmen, dass die Münzwürfe nur in der Geschwindigkeit variieren, dann würden wir Ω=[0,vmax]

Die Zufallsvariable kann dann als eine Funktion betrachtet werden, die jeden Anfangszustand ω Ω mit dem entsprechenden Ergebnis des Experiments abbildet , dh ob es sich um einen Schwanz oder einen Kopf handelt.XωΩ

Für den RV: das Maß Q entspräche dann auf das Wahrscheinlichkeitsmaß über die Anfangsbedingungen, die zusammen mit der Dynamik des Experiments durch X dargestellt werdenX:([0,vmax],B[0,vmax],Q)({0,1},2{0,1})QX bestimmt die Wahrscheinlichkeitsverteilung über die Ergebnisse.

Als Referenz für diese Idee können Sie sich die Kapitel von Tim Maudlin oder Micheal Strevens in "Probabilties in Physics" (2011) ansehen.

Sebastian
quelle