Varianz einer Funktion einer Zufallsvariablen

33

Nehmen wir an, wir haben die Zufallsvariable mit bekannter Varianz und Mittelwert. Die Frage ist: Was ist die Varianz von für eine gegebene Funktion f. Die einzige allgemeine Methode, die mir bekannt ist, ist die Delta-Methode, die jedoch nur eine Annäherung darstellt. Jetzt interessiere ich mich für , aber es wäre auch schön, einige allgemeine Methoden zu kennen.Xf(X)f(x)=x

Edit 29.12.2010
Ich habe einige Berechnungen mit Taylor-Reihen durchgeführt, bin mir aber nicht sicher, ob sie korrekt sind. Ich würde mich freuen, wenn jemand sie bestätigen könnte .

Zuerst müssen wir E[f(X)]
E[f(X)]E[f(μ)+f(μ)(Xμ)+12f(μ)(Xμ)2]=f(μ)+12f(μ)Var[X]

Nun können wir uns D2[f(X)]
E[(f(X)E[f(X)])2]E[(f(μ)+f(μ)(Xμ)+12f(μ)(Xμ)2E[f(X)])2]

Unter Verwendung der Approximation von E[f(X)] wissen wir, dass f(μ)Ef(x)12f(μ)Var[X]

Hiermit erhalten wir:
D2[f(X)]1D2[f(X)]14f(μ)2Var[X]212f(μ)2Var[X]2+f(μ)2Var[X]+14f(μ)2E[(Xμ)4]+12f(μ)f(μ)E[(Xμ)3]
D2[f(X)]14f(μ)2[D4X(D2X)2]+f(μ)D2X+12f(μ)f(μ)D3X

Tomek Tarczynski
quelle
Die Delta-Methode wird für asymptotische Verteilungen verwendet. Sie können nicht verwenden, wenn Sie nur eine Zufallsvariable haben.
mpiktas
@mpiktas: Eigentlich weiß ich nicht viel über die Delta-Methode, ich habe gerade etwas auf Wikipedia gelesen. Dies ist ein Zitat aus dem Wiki: "Die Delta-Methode verwendet Taylor-Expansionen zweiter Ordnung, um die Varianz einer Funktion einer oder mehrerer Zufallsvariablen zu approximieren."
Tomek Tarczynski
Wikipedia scheint genau das zu haben, was Sie wollen: en.wikipedia.org/wiki/… . Ich werde meine Antwort wiederholen, es scheint, dass ich Taylor Expansion unterschätzt habe.
mpiktas
Tomek, wenn Sie mit den vorgenommenen Änderungen nicht einverstanden sind (nicht von mir), können Sie sie jederzeit erneut ändern oder zurücksetzen oder einfach auf die Unterschiede hinweisen und um Klärung bitten.
Glen_b
2
@ Glen_b: Ich stimme ihnen zu. E (X-mu) = 0 impliziert nicht, dass E [(X-mu) ^ 3] = 0.
Tomek Tarczynski

Antworten:

33

Aktualisieren

Ich habe Taylor-Erweiterungen unterschätzt. Sie arbeiten tatsächlich. Ich nahm an, dass das Integral des Restbegriffs unbegrenzt sein kann, aber mit ein wenig Arbeit kann gezeigt werden, dass dies nicht der Fall ist.

Die Taylor-Erweiterung funktioniert für Funktionen in einem begrenzten geschlossenen Intervall. Für Zufallsvariablen mit endlicher Varianz gibt Chebyshev Ungleichung

P(|XEX|>c)Var(X)c

Also für jede können wir groß genug finden , so dasscε>0c

P(X[EXc,EX+c])=P(|XEX|c)<1ε

Lassen Sie uns zuerst schätzen . Wir haben wobei die Verteilungsfunktion für .E f ( X ) = | x - E X | c f ( x ) d F ( x ) + | x - E X | > c f ( x ) d F ( x ) F ( x ) XEf(X)

Ef(X)=|xEX|cf(x)dF(x)+|xEX|>cf(x)dF(x)
F(x)X

Da die Domäne des ersten Integrals das Intervall ist, das durch ein geschlossenes Intervall begrenzt ist, können wir die Taylor-Expansion anwenden: wobei und die Gleichheit für alle . Ich habe in der Taylor-Erweiterung nur 4 Terme genommen, aber im Allgemeinen können wir so viele nehmen, wie wir wollen, solange die Funktion glatt genug ist.f ( x ) = f ( E X ) + f ' ( E X ) ( x - E X ) + f " ( E X )[EXc,EX+c]α[EX-c,EX+c]x[EX-c,EX+c]f

f(x)=f(EX)+f(EX)(xEX)+f(EX)2(xEX)2+f(α)3(xEX)3
α[EXc,EX+c]x[EXc,EX+c]f

Ersetzen wir diese Formel durch die vorherige, die wir erhalten

Ef(X)=|xEX|cf(EX)+f(EX)(xEX)+f(EX)2(xEX)2dF(x)+|xEX|cf(α)3(xEX)3dF(x)+|xEX|>cf(x)dF(x)
Nun können wir den Bereich der Integration vergrößern, um die folgende Formel zu erhalten

Ef(X)=f(EX)+f(EX)2E(XEX)2+R3
where Nun können wir unter bestimmten Momentbedingungen zeigen, dass der zweite Term dieses Restterms so groß wie was klein ist. Leider bleibt der erste Term erhalten und so hängt die Qualität der Approximation von und dem Verhalten der dritten Ableitung von in begrenzten Intervallen ab. Eine solche Approximation sollte am besten für Zufallsvariablen mit funktionieren .
R3=f(α)3E(XEX)3++|xEX|>c(f(EX)+f(EX)(xEX)+f(EX)2(xEX)2+f(X))dF(x)
P(|XEX|>c)E(XEX)3fE(XEX)3=0

Nun können wir für die Varianz die Taylor-Näherung für , die Formel für subtrahieren und die Differenz . Dannf(x)Ef(x)

E(f(x)Ef(x))2=(f(EX))2Var(X)+T3

wobei Momente für . Wir können zu dieser Formel auch kommen, indem wir nur Taylor-Expansion erster Ordnung verwenden, dh nur die erste und die zweite Ableitung. Der Fehlerausdruck wäre ähnlich.T3E(XEX)kk=4,5,6

Ein anderer Weg ist, : f2(x)

f2(x)=f2(EX)+2f(EX)f(EX)(xEX)+[(f(EX))2+f(EX)f(EX)](XEX)2+(f2(β))3(XEX)3

Ebenso erhalten wir dann wobei ähnlich .

Ef2(x)=f2(EX)+[(f(EX))2+f(EX)f(EX)]Var(X)+R~3
R~3R3

Die Varianzformel wird dann wobei nur dritte Momente und mehr haben.~T3

Var(f(X))=[f(EX)]2Var(X)[f(EX)]24Var2(X)+T~3
T~3
mpiktas
quelle
Ich muss den genauen Wert der Varianz nicht kennen, die Approximation sollte für mich funktionieren.
Tomek Tarczynski
Tatsächlich wird die ungefähre Formel für im OP häufig in der Risikoanalyse in Wirtschaft, Finanzen und Versicherungen verwendet. E[f(X)]
Raskolnikov
@Raskolnikov, ja, aber es widerspricht meinem zugegebenermaßen veralteten Wissen über die Taylor-Expansion. Natürlich muss die Restlaufzeit berücksichtigt werden. Wenn die Zufallsvariable begrenzt ist, ist dies kein Problem, da Polynome stetige Funktionen im begrenzten Intervall gleichmäßig approximieren. Wir beschäftigen uns aber mit unbegrenzten Zufallsvariablen. Natürlich können wir für zufälliges Normal sagen, dass es effektiv begrenzt ist, aber im Allgemeinen können einige böse Überraschungen auftreten oder nicht. Ich werde meine Antwort korrigieren, sobald ich eine klare Antwort habe.
mpiktas
2
@Tomek Tarczynski, die dritte Ableitung von geht für großes ziemlich schnell auf Null , ist aber nahe Null unbegrenzt. Wenn Sie also eine gleichmäßige Verteilung mit einer Unterstützung nahe Null gewählt haben, kann die Restlaufzeit groß werden. xxx
mpiktas
1
Beachten Sie, dass in Ihrem Link die Gleichheit ungefähr ist. In dieser Antwort sind alle Gleichungen exakt. Außerdem für die Varianz beachten, dass die erste Ableitung an der geschätzt wird , nicht . Außerdem habe ich nie angegeben, dass dies für nicht funktioniert , nur, dass für die ungefähre Formel möglicherweise einen großen Fehler aufweist, wenn die Domäne nahe Null ist. x EXxx XxX
mpiktas
8

Die ersten beiden Momente von X (Mittelwert und Varianz) zu kennen, reicht nicht aus, wenn die Funktion f (x) willkürlich (nicht linear) ist. Nicht nur zur Berechnung der Varianz der transformierten Variablen Y, sondern auch für ihren Mittelwert. Um dies zu sehen - und vielleicht um Ihr Problem anzugreifen -, können Sie davon ausgehen, dass Ihre Transformationsfunktion eine Taylor-Erweiterung um den Mittelwert von X aufweist, und von dort aus arbeiten.

Leonbloy
quelle