Entspricht der Mittelwert einer univariaten Zufallsvariablen immer dem Integral ihrer Quantilfunktion?

17

Ich habe gerade bemerkt, dass die Integration der Quantilfunktion einer univariaten Zufallsvariablen (inverse cdf) von p = 0 nach p = 1 den Mittelwert der Variablen ergibt. Ich habe noch nie von dieser Beziehung gehört und frage mich: Ist das immer so? Wenn ja, ist diese Beziehung allgemein bekannt?

Hier ist ein Beispiel in Python:

from math import sqrt
from scipy.integrate import quad
from scipy.special import erfinv

def normalPdf(x, mu, sigma):
    return 1.0 / sqrt(2.0 * pi * sigma**2.0) * exp(-(x - mu)**2.0 / (2.0 * sigma**2.0))

def normalQf(p, mu, sigma):
    return mu + sigma * sqrt(2.0) * erfinv(2.0 * p - 1.0)

mu = 2.5
sigma = 1.3
quantileIntegral = quad(lambda p: quantile(p,mu,sigma), 0.0, 1.0)[0]
print quantileIntegral # Prints 2.5.
Tyler Streeter
quelle

Antworten:

26

Sei die CDF der Zufallsvariablen X , so kann die inverse CDF F - 1 geschrieben werden . In Ihrem Integral macht die Substitution p = F ( x ) , d p = F ' ( x ) d x = f ( x ) d x zu erhaltenFXF1p=F(x)dp=F(x)dx=f(x)dx

01F-1(p)dp=-xf(x)dx=EF[X].

Dies gilt für kontinuierliche Verteilungen. Bei anderen Distributionen ist Vorsicht geboten, da eine inverse CDF keine eindeutige Definition hat.

Bearbeiten

Wenn die Variable nicht stetig ist, hat sie keine in Bezug auf das Lebesgue-Maß absolut stetige Verteilung, was Sorgfalt bei der Definition der inversen CDF und Sorgfalt bei der Berechnung von Integralen erfordert. Betrachten Sie zum Beispiel den Fall einer diskreten Verteilung. Per Definition ist dies eine, deren CDF eine Schrittfunktion mit Schritten der Größe Pr F ( x ) bei jedem möglichen Wert x ist .FPrF(x)x

Abbildung 1

Diese Figur zeigt die CDF eines Bernoulli Verteilung skaliert durch 2 . Das heißt, der Zufallsvariable mit einer Wahrscheinlichkeit 1 / 3 von gleich 0 , und eine Wahrscheinlichkeit von 2 / 3 von gleich 2 . Die Höhen der Sprünge bei 0 und 2 geben ihre Wahrscheinlichkeiten an. Die Erwartung dieser Variablen entspricht offenbar 0 × ( 1 / 3 ) + 2 × ( 2 / 3 ) = 4(2/3)21/302/3202 .0×(1/3)+2×(2/3)=4/3

Wir könnten eine "inverse CDF" indem wir benötigenF1

F1(p)=x if F(x)p and F(x)<p.

Dies bedeutet, dass auch eine Sprungfunktion ist. Für jeden möglichen Wert x der Zufallsvariablen erreicht F - 1 den Wert x über ein Intervall der Länge Pr F ( x ) . Daher wird sein Integral erhalten, indem die Werte x Pr F ( x ) summiert werden , was nur die Erwartung ist.F1xF1xPrF(x)xPrF(x)

Figur 2

Dies ist der Graph der inversen CDF des vorhergehenden Beispiels. Die Sprünge von und 2 / 3 in der CDF werden horizontale Linien dieser Längen in der Höhe der gleich 0 und 2 , um die Werte , die Wahrscheinlichkeiten sie entsprechen. (Die inverse CDF nicht außerhalb des Intervalls definiert [ 0 , 1 ] .) Sein Integral die Summe von zwei Rechtecken ist, eine der Höhe 0 und Base 1 / 3 , die andere der Höhe 2 und Base 2 / 3 , insgesamt 4 / 31/32/302[0,1]01/322/34/3, wie vorher.

Im Allgemeinen müssen wir für eine Mischung aus einer kontinuierlichen und einer diskreten Verteilung die inverse CDF definieren, um diese Konstruktion zu parallelisieren: Bei jedem diskreten Sprung der Höhe müssen wir eine horizontale Linie der Länge p bilden, wie in der vorstehenden Formel angegeben.pp

whuber
quelle
Sie haben einen Fehler bei der Änderung der Variablen gemacht. woher kommt das x
Mascarpone
3
@ Mascarpone Bitte lesen Sie den Text vor der Gleichung. Ich glaube nicht, dass es einen Fehler bei der Änderung der Variablen gibt :-), aber wenn Sie glauben, dass dies die Darstellung verdeutlichen würde, würde ich gerne darauf hinweisen, dass wenn , dann x = F - 1 ( p ) . Ich habe einfach nicht gedacht, dass das notwendig ist. p=F(x)x=F1(p)
whuber
jetzt habe ich es bekommen;),
Mascarpone
+1 Whuber: Danke! Könnten Sie etwas genauer erläutern, um die von Ihnen angegebene Formel zu verwenden, wie Sie sich um andere Distributionen kümmern können, deren inverse CDF keine eindeutige Definition hat?
Tim
1
Um solche unangenehmen Überlegungen zu Inversen, Pseudoinversen und dergleichen zu umgehen und gleichzeitig eine Verallgemeinerung für jeden Moment zu finden, siehe hier .
Hat
9

Ein äquivalentes Ergebnis ist in bekannter Überlebensanalyse : die erwartete Lebensdauer ist wobei die Überlebensfunktion S ( t ) = Pr ( T > t ) ist, gemessen von Geburt an bei t = 0 . (Es kann leicht erweitert werden, um negative Werte von t abzudecken.)

t=0S(t)dt
S(t)=Pr(T>t)t=0t

Bildbeschreibung hier eingeben

So können wir dies umschreiben als aber das ist1 q = 0 F - 1 ( q )

t=0(1F(t))dt
wie in verschiedenen Überlegungen des betreffenden Gebiets gezeigt
q=01F1(q)dq

Bildbeschreibung hier eingeben

Henry
quelle
1
Ich mag Bilder und fühle instinktiv, dass hier eine großartige Idee lauert - ich liebe die Idee -, aber ich verstehe diese besonderen nicht. Erklärungen wären hilfreich. Eine Sache, die mich aufhält, ist der Gedanke, das Integral von auf - ∞ zu erweitern : es muss divergieren. (1F(t))dt
Whuber
@whuber: Wenn Sie möchten , negativ verlängern erhalten Sie t = 0 ( 1 - F ( t ) )t . Es ist zu beachten, dass, wenn dies für eine um 0 symmetrische Verteilung konvergiert, dh F ( t ) = 1 - F ( - t ), es leicht zu erkennen ist, dass die Erwartung Null ist. Einen Summe eher als eine Differenzt = 0 ( 1 - F ( t ) )t=0(1F(t))dtt=0F(t)dt0F(t)=1F(t) gibt die durchschnittliche absolute Abweichung um 0 an . t=0(1F(t))dt+t=0F(t)dt0
Henry
Wenn Sie Diagramme mögen, könnte Sie diese Arbeit von Lee aus dem Jahr 1988 interessieren: Die Mathematik der Überdeckung von Verlusten und das retrospektive Rating - ein grafischer Ansatz .
Avraham
4

Wir evaluieren:

Bildbeschreibung hier eingeben

Versuchen wir es mit einer einfachen Änderung der Variablen:

Bildbeschreibung hier eingeben

Und wir stellen fest, dass per Definition von PDF und CDF:

Bildbeschreibung hier eingeben

fast überall. Somit haben wir per Definition des erwarteten Wertes:

Bildbeschreibung hier eingeben

Mascarpone
quelle
In der letzten Zeile erkläre ich die Definition des erwarteten Wertes deutlicher. Das fast überall bezieht sich auf die Gleichung über der letzten. en.wikipedia.org/wiki/Almost_everywhere
Mascarpone
1
bearbeitet, Danke :)
Mascarpone
3

XF F1(U)XU(0,1)XF1(U)

E(X)=E(F1(U))=01F1(u)du.
XF1(U)FF1FF
Stéphane Laurent
quelle
1

F(x)P(Xx)F-1

F-1(p)=Mindest(x|F(x)p).
Das Mindestmacht Sinn wegen der richtigen Kontinuität. LassenU eine gleichmäßige Verteilung auf [0,1]. Das können Sie leicht überprüfenF-1(U) hat die gleiche CDF wie X, welches ist F. Dies ist nicht erforderlichXFortsetzung folgt. Daher,E(X)=E(F-1(U))=01F-1(p)dp. Das Integral ist das Riemann-Stieltjes-Integral . Die einzige Annahme, die wir brauchen, ist der Mittelwert vonX existiert (E|X|<).
WWang
quelle
That's the same answer as mine.
Stéphane Laurent