Sei die CDF der Zufallsvariablen X , so kann die inverse CDF F - 1 geschrieben werden . In Ihrem Integral macht die Substitution p = F ( x ) , d p = F ' ( x ) d x = f ( x ) d x zu erhaltenFXF−1p=F(x)dp = F′( x )dx =f( x )dx
∫10F- 1( p ) dp = ∫∞- ∞x f( x ) dx = EF[ X] .
Dies gilt für kontinuierliche Verteilungen. Bei anderen Distributionen ist Vorsicht geboten, da eine inverse CDF keine eindeutige Definition hat.
Bearbeiten
Wenn die Variable nicht stetig ist, hat sie keine in Bezug auf das Lebesgue-Maß absolut stetige Verteilung, was Sorgfalt bei der Definition der inversen CDF und Sorgfalt bei der Berechnung von Integralen erfordert. Betrachten Sie zum Beispiel den Fall einer diskreten Verteilung. Per Definition ist dies eine, deren CDF eine Schrittfunktion mit Schritten der Größe Pr F ( x ) bei jedem möglichen Wert x ist .FPrF( x )x
Diese Figur zeigt die CDF eines Bernoulli Verteilung skaliert durch 2 . Das heißt, der Zufallsvariable mit einer Wahrscheinlichkeit 1 / 3 von gleich 0 , und eine Wahrscheinlichkeit von 2 / 3 von gleich 2 . Die Höhen der Sprünge bei 0 und 2 geben ihre Wahrscheinlichkeiten an. Die Erwartung dieser Variablen entspricht offenbar 0 × ( 1 / 3 ) + 2 × ( 2 / 3 ) = 4(2/3)21/302/3202 .0×(1/3)+2×(2/3)=4/3
Wir könnten eine "inverse CDF" indem wir benötigenF−1
F−1(p)=x if F(x)≥p and F(x−)<p.
Dies bedeutet, dass auch eine Sprungfunktion ist. Für jeden möglichen Wert x der Zufallsvariablen erreicht F - 1 den Wert x über ein Intervall der Länge Pr F ( x ) . Daher wird sein Integral erhalten, indem die Werte x Pr F ( x ) summiert werden , was nur die Erwartung ist.F−1xF−1xPrF(x)xPrF(x)
Dies ist der Graph der inversen CDF des vorhergehenden Beispiels. Die Sprünge von und 2 / 3 in der CDF werden horizontale Linien dieser Längen in der Höhe der gleich 0 und 2 , um die Werte , die Wahrscheinlichkeiten sie entsprechen. (Die inverse CDF nicht außerhalb des Intervalls definiert [ 0 , 1 ] .) Sein Integral die Summe von zwei Rechtecken ist, eine der Höhe 0 und Base 1 / 3 , die andere der Höhe 2 und Base 2 / 3 , insgesamt 4 / 31/32/302[0,1]01/322/34/3, wie vorher.
Im Allgemeinen müssen wir für eine Mischung aus einer kontinuierlichen und einer diskreten Verteilung die inverse CDF definieren, um diese Konstruktion zu parallelisieren: Bei jedem diskreten Sprung der Höhe müssen wir eine horizontale Linie der Länge p bilden, wie in der vorstehenden Formel angegeben.pp
Ein äquivalentes Ergebnis ist in bekannter Überlebensanalyse : die erwartete Lebensdauer ist wobei die Überlebensfunktion S ( t ) = Pr ( T > t ) ist, gemessen von Geburt an bei t = 0 . (Es kann leicht erweitert werden, um negative Werte von t abzudecken.)
So können wir dies umschreiben als aber das ist ∫ 1 q = 0 F - 1 ( q )
quelle
Wir evaluieren:
Versuchen wir es mit einer einfachen Änderung der Variablen:
Und wir stellen fest, dass per Definition von PDF und CDF:
fast überall. Somit haben wir per Definition des erwarteten Wertes:
quelle
quelle
quelle