Inverse Funktion der Varianz

9

Ist es für eine gegebene konstante Zahl (zB 4) möglich, eine Wahrscheinlichkeitsverteilung für , so dass wir ?X V a r ( X ) = rrXVar(X)=r

amiref
quelle
1
Nein, es sei denn, Sie haben zusätzliche Informationen.
Hemant Rupani
@Hemant Rupani Welche zusätzlichen Informationen werden benötigt?
Amiref
1
jede Art von Zufallsvariable 'X'…
Hemant Rupani
3
Ich schlage vor, Sie bearbeiten Ihre Frage, um "Wert für X" durch "Verteilung für X" zu ersetzen. Wenn X nur einen einzigen Wert hat, hat X eine entartete Verteilung und die Varianz Null.
Silverfish
1
Wenn nicht negativ ist, lautet die Antwort offensichtlich ja, eine Varianz kann eine beliebige positive Zahl sein. r
Dsaxton

Antworten:

13

Betrachten Sie die Fälle für sorgfältig : Wenn ist die Verteilung entartet, aber könnte einen beliebigen Mittelwert haben. Das heißt, und \ Pr (X = c) = 0 für jedes c \ neq \ mu . Wir können also viele mögliche Verteilungen für X finden , aber sie werden durch \ mu \ in \ mathbb {R} indiziert und vollständig angegeben .r = 0 X Pr ( X = μ ) = 1 Pr ( X = c ) = 0 c μ X μ R.rr=0XPr(X=μ)=1Pr(X=c)=0cμXμR

Wenn , kann keine Verteilung gefunden werden, da .V a r ( X ) = E ( X - μ X ) 20r<0Var(X)=E(XμX)20

Für hängt die Antwort davon ab, welche zusätzlichen Informationen über . Wenn beispielsweise bekannt ist, dass Mittelwert , können wir für jedes und eine Verteilung mit diesen Momenten finden, indem wir . Dies ist keine eindeutige Lösung für das Problem der Übereinstimmung von Mittelwert und Varianz, aber es ist die einzige normalverteilte Lösung (und von allen möglichen Lösungen ist dies diejenige, die die Entropie maximiert, wie Daniel betont). Wenn Sie beispielsweise auch mit dem dritten zentralen Moment oder höher übereinstimmen möchten, müssen Sie einen breiteren Bereich von Wahrscheinlichkeitsverteilungen berücksichtigen.X X μ μ R r > 0 X N ( μ , r )r>0XXμμRr>0XN(μ,r)

Angenommen, wir hätten stattdessen einige Informationen über die Verteilung von und nicht über seine Momente. Wenn wir beispielsweise wissen, dass einer Poisson-Verteilung folgt, wäre die eindeutige Lösung . Wenn wir wissen, dass einer Exponentialverteilung folgt, gibt es wieder eine eindeutige Lösung , bei der wir den Parameter durch Lösen von .X X ~ P o i s s o n ( r ) X X ~ E x p o n e n t i ein l ( 1XXXPoisson(r)XVar(X)=r=1XExponential(1r)Var(X)=r=1λ2

In anderen Fällen können wir eine ganze Familie von Lösungen finden. Wenn wir wissen, dass einer rechteckigen (kontinuierlichen gleichmäßigen) Verteilung folgt, können wir eine eindeutige Breite für die Verteilung finden, indem wir lösen . Es wird jedoch eine ganze Familie von Lösungen geben, die durch parametrisiert sind - die Verteilungen in dieser Menge sind alle Übersetzungen voneinander. In ähnlicher Weise würde, wenn normal ist, jede Verteilung funktionieren (also haben wir eine ganze Reihe von durch indizierten Lösungen , die wiederum eine beliebige reelle Zahl sein können, und wieder sind die Familien alle Übersetzungen von einander). Wennw V a r ( X ) = r = w 2Xw XU(a,a+w)aRXXN(μ,r)μXXGamma(rVar(X)=r=w212XU(a,a+w)aRXXN(μ,r)μX folgt einer Gammaverteilung, dann können wir unter Verwendung der Formskalenparametrisierung eine ganze Familie von Lösungen erhalten, parametrisiert durch . Mitglieder dieser Familie sind keine Übersetzungen voneinander. Um zu veranschaulichen, wie eine "Familie von Lösungen" aussehen könnte, finden Sie hier einige Beispiele für Normalverteilungen, die mit indiziert sind , und dann Gammaverteilungen, die mit indiziert sind , alle mit einer Varianz von vier, entsprechend dem Beispiel in Ihre Frage.θ>0μθr=4XGamma(rθ2,θ)θ>0μθr=4

Normalverteilungen mit Varianz vier Gammaverteilungen mit Varianz vier

Andererseits kann es für einige Verteilungen abhängig vom Wert von möglich sein, eine Lösung zu finden oder nicht . Wenn beispielsweise eine Bernoulli-Variable sein muss, gibt es für zwei mögliche Lösungen da es zwei Wahrscheinlichkeiten die die Gleichung , und tatsächlich sind diese beiden Wahrscheinlichkeiten komplementär, dh . Für gibt es nur die eindeutige Lösung , und für weist keine Bernoulli-Verteilung eine ausreichend hohe Varianz auf.X 0 r < 0,25 X ~ B e r n o u l l i ( p ) , p V a r ( X ) = r = p ( 1 - p ) p 1 + p 2 = 1 r = 0,25 p = 0,5 r > 0,25rX0r<0.25XBernoulli(p)pVar(X)=r=p(1p)p1+p2=1r=0.25p=0.5r>0.25

Ich denke, ich sollte auch den Fall erwähnen . Auch für diesen Fall gibt es Lösungen, zum Beispiel eine Student- Verteilung mit zwei Freiheitsgraden.tr=t

R-Code für Diagramme

require(ggplot2)

x.df  <- data.frame(x = rep(seq(from=-8, to=8, length=100), times=5),
    mu = rep(c(-4, -2, 0, 2, 4), each=100))
x.df$pdf <- dnorm(mean=x.df$mu, x.df$x)
ggplot(x.df, aes(x=x, y=pdf, group=factor(mu), colour=factor(mu))) + theme_bw() + 
    geom_line(size=1) + scale_colour_brewer(name=expression(mu), palette="Set1") +
    theme(legend.key = element_blank()) + ggtitle("Normal distributions with variance 4")

x.df  <- data.frame(x = rep(seq(from=0, to=20, length=1000), times=5),
    theta = rep(c(0.25, 0.5, 1, 2, 4), each=1000))
x.df$pdf <- dgamma(x.df$x, shape=4/(x.df$theta)^2, scale=x.df$theta)
ggplot(x.df, aes(x=x, y=pdf, group=factor(theta), colour=factor(theta))) + theme_bw() + 
    geom_line(size=1) + scale_colour_brewer(name=expression(theta), palette="Set1") +
    theme(legend.key = element_blank()) + ggtitle("Gamma distributions with variance 4") +
    coord_cartesian(ylim = c(0, 1)) 
Silberfisch
quelle
17

Angenommen, Sie meinen "ist es möglich, eine Wahrscheinlichkeitsverteilung für zu finden", lautet die Antwort "Ja", da Sie keine Kriterien angegeben haben, die erfüllen muss. Tatsächlich gibt es unendlich viele mögliche Verteilungen, die diese Bedingung erfüllen würden. Betrachten Sie einfach eine Normalverteilung, . Sie können und kann einen beliebigen Wert annehmen - Sie haben dann nach Bedarf.X N ( x ; μ , σ 2 ) σ 2 = r μ V a r [ X ] = rXXN(x;μ,σ2)σ2=rμVar[X]=r

Tatsächlich ist die Normalverteilung in dieser Hinsicht ziemlich speziell, da sie die maximale Entropiewahrscheinlichkeitsverteilung für einen gegebenen Mittelwert und eine gegebene Varianz ist.

Daniel
quelle
Du hast recht, ich habe es korrigiert. Würden Sie bitte mehr erklären?
Amiref
@AmirEf Was ist unklar?
Daniel
6
Es ist überhaupt nicht klar, was Daniel sonst noch erklären sollte; Die Antwort hier scheint alles in Ihrer gestellten Frage zu behandeln.
Glen_b -Reinstate Monica
15

Diese Frage kann so interpretiert werden, dass sie interessant und nicht ganz trivial ist. Inwieweit ist es bei etwas , das wie eine Zufallsvariable aussieht , möglich, seinen Werten Wahrscheinlichkeiten zuzuweisen (oder vorhandene Wahrscheinlichkeiten so zu verschieben), dass seine Varianz einer vorgegebenen Zahl r entspricht ? Die Antwort ist, dass alle möglichen Werte r 0 bis zu einer durch den Bereich von X bestimmten Grenze zulässig sind .Xrr0X

Das potenzielle Interesse an einer solchen Analyse liegt in der Idee, ein Wahrscheinlichkeitsmaß zu ändern und dabei eine Zufallsvariable festzuhalten, um ein bestimmtes Ziel zu erreichen. Obwohl diese Anwendung einfach ist, zeigt sie einige der Ideen, die dem Girsanov-Theorem zugrunde liegen , ein Ergebnis, das für die mathematische Finanzierung von grundlegender Bedeutung ist.


Lassen Sie uns diese Frage rigoros und eindeutig wiederholen. Annehmen

X:(Ω,S)R

ist eine messbare Funktion, die auf einem Messraum mit Sigma-Algebra S definiert ist . Wann ist es für eine gegebene reelle Zahl r > 0 möglich, ein Wahrscheinlichkeitsmaß P auf diesem Raum zu finden, für das Var ( X ) = r ist ?ΩSr>0PVar(X)=r

Ich glaube, die Antwort ist, dass dies möglich ist, wenn . sup(X)inf(X)>2r (Gleichheit kann gelten, wenn sowohl das Supremum als auch das Infimum erreicht werden: Das heißt, sie sind tatsächlich das Maximum und Minimum von) Wenn entwedersup(X)=oderinf(X)=-, setzt diese Bedingung keine Grenzenr, und dann sind alle nicht negativen Werte der Varianz möglich.Xsup(X)=inf(X)=r

Der Beweis ist durch Konstruktion. Beginnen wir mit einer einfachen Version, um uns um die Details zu kümmern, die Grundidee festzulegen und dann mit der eigentlichen Konstruktion fortzufahren.

  1. Sei im Bild von X : Dies bedeutet, dass es ein ω xΩ gibt, für das X ( ω x ) = x ist . Definieren Sie die eingestellte Funktion P : S[ 0 , 1 ] als Indikator für ω x : dh P ( A ) = 0, wenn ω xA und P ( A ) = 1, wenn ω xxXωxΩX(ωx)=xP:S[0,1]ωxP(A)=0ωxAP(A)=1 .ωxA

    Da , erfüllt P offensichtlich die ersten beiden Wahrscheinlichkeitsaxiome . Es ist notwendig zu zeigen, dass es das dritte erfüllt; nämlich, dass es Sigma-Additiv ist. Dies ist jedoch fast genauso offensichtlich: Wenn { E i , i = 1 , 2 , } eine endliche oder zählbar unendliche Menge sich gegenseitig ausschließender Ereignisse ist, enthält keines von beiden ω x - in diesem Fall P ( E i ) = 0 für alle iP(Ω)=1P{Ei,i=1,2,}ωxP(Ei)=0i- oder genau einer von ihnen enthält , in welchem ​​Fall P ( E j ) = 1 für ein bestimmtes j und ansonsten P ( E i ) = 0 für alle i j . In beiden FällenωxP(Ej)=1jP(Ei)=0ij

    P(iEi)=iP(Ei)

    weil beide Seiten entweder beide oder beide 1 sind .01

    Da gesamte Wahrscheinlichkeit auf ω x konzentriert , ist die Verteilung von X auf x konzentriert und X muss eine Varianz von Null aufweisen.PωxXxX

  2. Sei zwei Werte im Bereich von X ; das heißt, X ( ω 1 ) = x 1 und X ( ω 2 ) = x 2 . Definieren Sie in ähnlicher Weise wie im vorherigen Schritt ein Maß P als gewichteten Durchschnitt der Indikatoren von ω 1 und ω 2 . Verwenden Sie nicht negative Gewichte 1 - p und p für p zu bestimmen. Nach wie vor finden wir, dass P.x1x2XX(ω1)=x1X(ω2)=x2Pω1ω21pppP- eine konvexe Kombination der in (1) diskutierten Indikatormaße zu sein - ist ein Wahrscheinlichkeitsmaß. Die Verteilung von in Bezug auf dieses Maß ist eine Bernoulli ( p ) -Verteilung, die um x 2 - x 1 skaliert und um - x 1 verschoben wurde . Da die Varianz einer Bernoulli ( p ) Verteilung p ( 1 - p ) , die Varianz von X sein muss ( x 2 - x 1 ) 2 P (X(p)x2x1x1(p)p(1p)X .(x2x1)2p(1p)

Eine unmittelbare Folge von (2) ist, dass jedes für das x 1x 2 im Bereich von X und 0 p < 1 existiert, für das existiertrx1x2X0p<1

r=(x2x1)2p(1p)

kann die Varianz von . Da 0 p ( 1 - p ) 1 / 4 , bedeutet dies ,X0p(1p)1/4

2r=4rrp(1p)=(x2x1)2=x2x1sup(X)inf(X),

X

r(sup(X)inf(X))2/4

whuber
quelle
3
Alter, ich denke du bist auf einer ganz anderen Ebene als das OP.
Mark L. Stone
4
@ Mark wahrscheinlich. (Ich denke, Sie haben hier einen Hauch von sehr trockenem Humor entdeckt.) Aber jeder, der das Tag für mathematische Statistiken auf seinen Beitrag anwendet, sollte mit solchen Dingen rechnen :-).
whuber
2
Es erinnert mich irgendwie daran, als ich eine 4-Schüler-Klasse des verstorbenen Prof Samuel Karlin (unter anderem von Karlin und Taylor) über "Total Positivity" belegte. Das Thema Spieltheorie kam irgendwie auf. Er sagte, oh, Spieltheorie. Sie haben zwei nicht negative Sigma-endliche Maßnahmen ..., Stellen Sie sich nun vor, er führt die Spieltheorie auf diese Weise in eine Klasse für Studienanfänger an einer Hochschule für freie Künste ein. Daran habe ich bei Ihrem Beitrag gedacht.
Mark L. Stone
@ Mark verstanden. Das würde man nicht tun und Erfolg haben. Wie Sie hervorheben, schreibe ich hier eher für (eine Untergruppe von) allgemeinen Lesern als für einen bestimmten. Auf der anderen Seite ist das abstrakte Fach (auf dieser Grundstufe) nicht schwierig und hat sich für motivierte Underclassmen an Liberal Arts Colleges als zugänglich erwiesen. Siehe zum Beispiel die Kommentare unter stats.stackexchange.com/a/94876 .
whuber
4
@ MarkL.Stone Antworten sind mehr als nur für den unmittelbaren Fragesteller (SE soll ein Aufbewahrungsort für gute Fragen und gute Antworten sein, die für spätere Personen mit ähnlichen Fragen wertvoll sind), und wir haben hier bereits Antworten für die elementarere Sicht auf die Frage . Einige andere Leser können etwas aus der weniger elementaren Sichtweise herausholen, so dass eine Vielzahl von Stilen und Antwortstufen die Frage für mehr Menschen nützlich macht.
Glen_b -State Monica
10

Var[cX]=c2Var[X]

[0,1]

σ2=112
[0,112r]r

ννξ=tμsμ,sξ

Aksakal
quelle