Welche intuitive Bedeutung hat das Einfügen einer Zufallsvariablen in ein eigenes PDF oder PDF?

9

Ein PDF wird normalerweise als , wobei der Kleinbuchstabe als Realisierung oder Ergebnis der Zufallsvariablen die dieses PDF enthält. In ähnlicher Weise wird ein cdf als , was die Bedeutung . Unter bestimmten Umständen, wie der Definition der Bewertungsfunktion und dieser Ableitung, dass das cdf gleichmäßig verteilt ist , scheint es jedoch, dass die Zufallsvariable in ihr eigenes pdf / cdf eingefügt wird; Auf diese Weise erhalten wir eine neue Zufallsvariable oderf(x|θ)xX.F.X.(x)P.(X.<x)X. Y.=f(X.|θ)Z.=F.X.(X.). Ich glaube nicht, dass wir dies mehr als pdf oder cdf bezeichnen können, da es jetzt selbst eine Zufallsvariable ist, und im letzteren Fall scheint mir die "Interpretation" Unsinn zu sein.F.X.(X.)=P.(X.<X.)

Außerdem bin ich mir im letzteren Fall nicht sicher, ob ich die Aussage "das cdf einer Zufallsvariablen folgt einer gleichmäßigen Verteilung" verstehe. Das cdf ist eine Funktion, keine Zufallsvariable und hat daher keine Verteilung. Vielmehr hat eine gleichmäßige Verteilung die Zufallsvariable, die mit der Funktion transformiert wurde, die ihr eigenes cdf darstellt, aber ich verstehe nicht, warum diese Transformation sinnvoll ist. Gleiches gilt für die Score-Funktion, bei der eine Zufallsvariable in die Funktion eingefügt wird, die ihre eigene Log-Wahrscheinlichkeit darstellt.

Ich habe mir wochenlang den Kopf zerbrochen, um eine intuitive Bedeutung für diese Transformationen zu finden, aber ich stecke fest. Jeder Einblick wäre sehr dankbar!

Mai
quelle
4
Die Notation kann Sie verwirren. Beispiel ist genau so sinnvoll wie die Anwendung jede messbare Funktion wäre. Für eine korrekte Interpretation müssen Sie sich sehr klar darüber sein, was eine Zufallsvariable ist . Für jede Zufallsvariable die Funktion für eindeutig eine Zufallsvariable und hat daher eine Verteilung(Beachten Sie die zwei unterschiedlichen Bedeutungen des Symbols " " in " ".) ist genau dann einheitlich, wenn eine kontinuierliche Verteilung hat. X X : & OHgr; R , Y : ω F X ( X ( ω ) ) ω & OHgr; F Y . X F X ( X ) F Y X.F.X.(X.)X.X.::ΩR.,
Y.::ωF.X.(X.(ω))
ωΩF.Y..X.F.X.(X.)F.Y.X.
whuber
1
Dies ist nicht wirklich ein messungstheoretisches Problem: Um es zu verstehen, können Sie alle Verweise auf "Messbarkeit" ignorieren. Sie könnten davon profitieren, wenn Sie zu Beginn Ihrer Abschlusskarriere ein wenig Mengenlehre studieren: Dort lernen die meisten Menschen, was diese grundlegende (und allgegenwärtige) mathematische Terminologie und Notation wirklich bedeutet. Es ist also am besten, das Lernen nicht zu verschieben.
whuber
Vielleicht ein Wort darüber, warum man so etwas Verrücktes tun sollte: ein Wohnmobil in seine eigene Dichte einfügen !!?! Ein Beispiel: Angenommen, Sie möchten die Dichte von X schätzen, dann können Sie messen, wie gut Sie sind, indem Sie über Dies ist jedoch „unfair“: Sie werden niemals eine gute Annäherung erzielen, wenn Sie keine haben viele Datenbeispiele (dh die wahre Dichte ist klein). Eine „faire“ Bewertung wäre daher, den Begriff mit der wahren Dichte zu gewichten. Dies ist mehr oder weniger der Effekt des Einfügens von RV in ihre eigenen Dichten ...f(x)- -fX.(x)
Fabian Werner

Antworten:

8

Wie Sie sagen, ist jede (messbare) Funktion einer Zufallsvariablen selbst eine Zufallsvariable. Es ist einfacher, sich und F ( x ) als "irgendeine alte Funktion" vorzustellen. Sie haben einfach einige schöne Eigenschaften. Wenn X beispielsweise ein exponentielles Standard-RV ist, ist die Zufallsvariable Y = 1 - e - X nicht besonders seltsam. Es kommt einfach so vor, dass Y = F X ( X ) . Die Tatsache, dass Y eine gleichmäßige Verteilung hat (vorausgesetzt, dass X.f(x)F.(x)X.

Y.=1- -e- -X.
Y.=F.X.(X.)Y.X.ist ein kontinuierliches RV) kann für den allgemeinen Fall durch Ableiten der CDF von .Y.

F.Y.(y)=P.(Y.y)=P.(F.X.(X.)y)=P.(X.F.X.- -1(y))=F.X.(F.X.- -1(y))=y

Welches ist eindeutig die CDF einer Zufallsvariablen. Hinweis: In dieser Version des Beweises wird davon ausgegangen, dass F X ( x ) streng ansteigt und kontinuierlich ist, es ist jedoch nicht viel schwieriger, eine allgemeinere Version anzuzeigen.U.(0,1)F.X.(x)

knrumsey
quelle
1
Ihre Schlussfolgerung ist falsch für die strengste Erhöhung von : Sie haben angenommen, dass F XF - 1 X die Identität ist - aber das ist nicht immer der Fall. F.X.F.X.F.X.- -1
whuber
Ja Dankeschön. Die Zufallsvariable muss eindeutig stetig sein. Vermisse ich jetzt etwas? X.
Knrumsey
1
muss nicht bijektiv sein. Nehmen wir zum Beispiel den Fall, dass X selbst eine gleichmäßige Verteilung hat! Das Schließen des Bildes von F X muss das gesamte Intervall sein [ 0 , 1 ] . Das ist im Wesentlichen die Definition einer kontinuierlichen Verteilung. F.X.X.F.X.[0,1]].
whuber
11

Eine Transformation einer Zufallsvariablen durch eine messbare Funktion T : XY ist eine weitere Zufallsvariable Y = T ( X ), deren Verteilung durch die inverse Wahrscheinlichkeitstransformation P ( Y A ) = P ( X { x ;X.T.::X.Y.Y.=T.(X.) für alle Mengen A, so dass { x ;

P.(Y.EIN)=P.(X.{x;;T.(x)EIN}})=defP.(X.T.- -1(EIN))
EIN ist unter der Verteilung von X messbar.{x;;T.(x)EIN}}X.

Diese Eigenschaft gilt für den Sonderfall, wenn das cdf der Zufallsvariablen ist. X : Y = F X ( X ) ist eine neue Zufallsvariable, die ihre Realisierungen in [ 0 , 1 ] übernimmt . Zufällig wird Y als einheitliches U ( [ 0 , 1 ] ) verteilt, wenn F X stetig ist. (Wenn F X.F.X.::X.[0,1]]X.Y.=F.X.(X.)[0,1]]Y.U.([0,1]])F.X.F.X.diskontinuierlich ist, ist der Bereich von nicht mehr [ 0 , 1 ] . Was immer der Fall ist, ist, dass wenn U ein einheitliches U ( [ 0 , 1 ] ) ist , F - X ( U ) die gleiche Verteilung wie X hat , wobei F - X die verallgemeinerte Umkehrung von F X bezeichnet . Dies ist ein formaler Weg, um (a) Zufallsvariablen als messbare Transformationen eines Fundamentals zu verstehenY.=F.X.(X.)[0,1]]U.U.([0,1]])F.X.- -(U.)X.F.X.- -F.X. da X ( ω ) = F - X ( ω ) eine Zufallsvariable mit cdf F X ist und (b)Zufallsvariablenaus einer gegebenen Verteilung mit cdf F X erzeugt .)ωΩX.(ω)=F.X.- -(ω)F.X.F.X.

Um das Paradoxon von zu verstehen , nehmen Sie die Darstellung F X ( x ) = P ( X x ) = x 0 d F X ( x ) = x 0 f X ( x )P.(X.X.) wenn d λ das dominierende Maß und f X die entsprechende Dichte ist. Dann ist F X ( X ) = X 0 d F X ( x ) = X 0 f X ( x )

F.X.(x)=P.(X.x)=0xdF.X.(x)=0xfX.(x)dλ(x)
dλfX. ist eine Zufallsvariable, da die Obergrenze des Integrals zufällig ist. (Dies ist der einzige zufällige Teil des Ausdrucks.) Der offensichtliche Widerspruch in P ( X X ) beruht auf einer Verwechslung der Notationen. Um richtig definiert zu werden, benötigt man zwei unabhängige Versionen der Zufallsvariablen X , X 1 und X 2 , in welchem ​​Fall die Zufallsvariable F X ( X 1 ) durch F X ( X 1 ) = P X 2 definiert ist
FX(X)=0XdFX(x)=0XfX(x)dλ(x)
P(XX)XX1X2FX(X1) die Wahrscheinlichkeit, die für die Verteilung von X 2 berechnet wird.
FX(X1)=PX2(X2X1)
X2

fX(X)fX.fX.(X.|θ^(X.))/.fX.(X.|θ0)χ2

LogfX.(X.|θ)θ
θ
E.θ0[LogfX.(X.|θ0)θ]]=LogfX.(x|θ0)θfX.(x|θ0)dλ(x)=0

[Antwort eingegeben, während @whuber und @knrumsey ihre jeweiligen Antworten eingaben!]

Xi'an
quelle
F.X.(X.1)=P.(X.2X.1)
F.X.X.F.X.(X.)
Ja, ich stimme zu, dass sie nicht dasselbe sind. In erster Linie ist es kein Wohnmobil, während es im zweiten Fall ein Wohnmobil ist. Bin ich richtig?
mai
X.F.X.(X.)
θθθ