Erwarteter Wert von x in einer Normalverteilung, GEGEBEN, dass er unter einem bestimmten Wert liegt

12

Ich frage mich nur, ob es möglich ist, den erwarteten Wert von x zu finden, wenn er normalverteilt ist, da dieser unter einem bestimmten Wert liegt (z. B. unter dem Mittelwert).

Jasmin
quelle
Es ist natürlich möglich. Zumindest könnte man durch rohe Kraft berechnen F(t)1xtf(t)dt. Oder wenn Sie μ und σ Sie es mithilfe einer Simulation schätzen.
Dsaxton
@dsaxton Es gibt einige Tippfehler in dieser Formel, aber wir bekommen die Idee. Ich bin gespannt, wie genau Sie die Simulation ausführen würden, wenn der Schwellenwert weit unter dem Mittelwert liegt.
whuber
1
@whuber Ja, F(t) sollte F(x) . Es wäre nicht sehr klug, eine Simulation durchzuführen , wenn F(x) nahe Null ist, aber wie Sie betont haben, gibt es sowieso eine genaue Formel.
Dsaxton
@ Dsaxton OK, fair genug. Ich hatte nur gehofft, Sie hätten eine clevere und einfache Idee, um vom Ende einer Normalverteilung aus zu simulieren.
whuber
Mehr oder weniger die gleiche Frage in Math.SE: math.stackexchange.com/questions/749664/average-iq-of-mensa
JiK

Antworten:

18

Eine normalverteilte Variable X mit dem Mittelwert μ und der Varianz σ2 hat die gleiche Verteilung wie σZ+μ wobei Z eine Standardnormalvariable ist. Alles was Sie über wissen müssen, Zist das

  • seine kumulative Verteilungsfunktion heißt Φ ,
  • es hat eine Wahrscheinlichkeitsdichtefunktion ϕ(z)=Φ(z) , und das
  • ϕ(z)=zϕ(z) .

Die ersten beiden Aufzählungszeichen sind nur Notation und Definitionen: Das dritte ist die einzige spezielle Eigenschaft von Normalverteilungen, die wir benötigen.

Lassen Sie den „bestimmten Wert“ sein . Im Vorgriff auf die Änderung von X zu Z definierenTXZ

t=(Tμ)/σ,

damit

Pr(XT)=Pr(Zt)=Φ(t).

Beginnend mit der Definition der bedingten Erwartung können wir dann ihre Linearität ausnutzen, um zu erhalten

E(X|XT)=E(σZ+μ|Zt)=σE(Z|Zt)+μE(1|Zt)=(σtzϕ(z)dz+μtϕ(z)dz)/Pr(Zt)=(σtϕ(z)dz+μtΦ(z)dz)/Φ(t).

Der Fundamentalsatz des Kalküls besagt, dass jedes Integral einer Ableitung durch Auswertung der Funktion an den Endpunkten gefunden wird: . Dies gilt für beide Integrale. Da sowohl Φ als auch ϕ bei - verschwinden müssen , erhalten wirabF(z)dz=F(b)F(a)Φϕ

E(X|XT)=μσϕ(t)Φ(t).

Dies ist der ursprüngliche Mittelwert abzüglich eines Korrekturterms, der proportional zum Inverse Mills Ratio ist .

![figure: plot of the inverse Mills ratio

Wie zu erwarten ist, muss das inverse Mills-Verhältnis für positiv sein und - t überschreiten (dessen Grafik mit einer gepunkteten roten Linie dargestellt ist). Es muss auf 0 sinken, wenn t groß wird, denn dann ändert die Kürzung bei Z = t (oder X = T ) fast nichts. Wenn t sehr negativ wird, muss sich das inverse Mills-Verhältnis annähern - t, da die Schwänze der Normalverteilung so schnell abnehmen, dass fast die gesamte Wahrscheinlichkeit im linken Schwanz nahe seiner rechten Seite (bei t ) konzentriert ist.tt0tZ=tX=Tttt

Wenn schließlich im Mittelwert liegt, ist t = 0, wobei das inverse Mills-Verhältnis gleich √ istT=μt=0. Dies impliziert, dass der erwartete Wert vonX, der im Mittel abgeschnitten ist (was das Negative einerhalben Normalverteilung ist),- √ ist2/π0.797885X fache Standardabweichung unter dem ursprünglichen Mittelwert.2/π

whuber
quelle
6

Im Allgemeinen soll die Verteilungsfunktion F ( X ) haben .XF(X)

Wir haben für , P ( X x | c 1X c 2 )x[c1,c2] Sie können Sonderfälle erhalten, indem Sie zum Beispielc1=-∞ nehmen, wasF(c1)=0ergibt.

P(Xx|c1Xc2)=P(Xxc1Xc2)P(c1Xc2)=P(c1Xx)P(c1Xc2)=F(x)F(c1)F(c2)F(c1)
c1=F(c1)=0

Mit bedingten cdfs erhalten Sie möglicherweise bedingte Dichten (z. B. für X N ( 0 , 1 ) ), die für bedingte Erwartungen verwendet werden können.f(x|X<0)=2ϕ(x)XN(0,1)

E(X|X<0)=20xϕ(x)=2ϕ(0),
Christoph Hanck
quelle
+1 (irgendwie habe ich das verpasst, als es zum ersten Mal erschien). Der erste Teil ist eine hervorragende Darstellung, wie man abgeschnittene Verteilungsfunktionen erhält, und der zweite Teil zeigt, wie man ihre PDFs berechnet.
whuber