Einheitliche Zufallsvariable als Summe zweier Zufallsvariablen

18

Entnommen aus Grimmet und Stirzaker :

Zeigen Sie, dass es nicht möglich ist, dass U=X+Y wenn U gleichmäßig auf [0,1] verteilt ist und X und Y unabhängig und gleich verteilt sind. Sie sollten nicht davon ausgehen, dass X und Y kontinuierliche Variablen sind.

Ein einfacher Widerspruchsbeweis genügt für den Fall, dass X , Y diskret angenommen werden, indem argumentiert wird, dass es immer möglich ist, ein u und ein zu finden ,u so dass P(Uu+u)P(Uu) während P(X+Yu)=P(X+Yu+u) .

Dieser Beweis erstreckt sich jedoch nicht auf X,Y absolut stetig oder singulär stetig ist. Hinweise / Kommentare / Kritik?

rechtekewed
quelle
3
Hinweis : Charakteristische Funktionen sind Ihre Freunde.
Kardinal
1
X und Y sind iid, daher müssen ihre charakteristischen Funktionen identisch sein. Sie müssen die charakteristische Funktion verwenden und nicht die Funktion zur Momentenerzeugung. Es kann nicht garantiert werden, dass die mgf für X existiert. Wenn Sie also anzeigen, dass die mgf eine unmögliche Eigenschaft hat, bedeutet dies nicht, dass es kein solches X gibt. Alle Wohnmobile haben eine charakteristische Funktion. Wenn Sie also zeigen, dass eine unmögliche Eigenschaft vorliegt, gibt es kein solches X.
Silverfish
1
Wenn die Verteilungen von und Y irgendwelche Atome haben , sagen Sie, dass P { X = a } = P { Y = a } = b > 0 , dann ist P { X + Y = 2 a } b 2 > 0 und somit X + Y kann nicht gleichmäßig verteilt werden auf [ 0 , 1 ]XYP{X=a}=P{Y=a}=b>0P{X+Y=2a}b2>0X+Y[0,1]. Somit ist es nicht notwendig, den Fall der Verteilungen von und Y mit Atomen zu betrachten. XY
Dilip Sarwate

Antworten:

13

Das Ergebnis lässt sich mit einem Bild belegen: Die sichtbaren grauen Bereiche zeigen, dass eine gleichmäßige Verteilung nicht als Summe zweier unabhängiger gleichverteilter Variablen zerlegt werden kann.

Notation

Sei und Y so, dass X + Y eine gleichmäßige Verteilung auf [ 0 , 1 ] hat . Dies bedeutet, dass für alle 0 a b 1 ,XYX+Y[0,1]0ab1

Pr(a<X+Yb)=ba.

Die wesentliche Unterstützung der gemeinsamen Verteilung von und Y ist daher [ 0 , 1 / 2 ] (denn sonst würde es positive Wahrscheinlichkeit , dass X + Y liegt außerhalb [ 0 , 1 ] ).XY[0,1/2]X+Y[0,1]

Das Bild

Lassen . Betrachten Sie dieses Diagramm, das zeigt, wie Summen von Zufallsvariablen berechnet werden:0<ϵ<1/4

Zahl

Die zugrunde liegende Wahrscheinlichkeitsverteilung ist die gemeinsame für . Die Wahrscheinlichkeit eines Ereignisses a < X + Y b ergibt sich aus der Gesamtwahrscheinlichkeit des sich zwischen den Linien x + y erstreckenden Diagonalbandes(X,Y)a<X+Yb und x + y = b. Drei solcher Bänder sind gezeigt: von 0 bis ϵ , die als kleines blaues Dreieck unten links erscheinen; von 1 / 2 - ε zu 1 / 2x+y=ax+y=b0ϵ1/2ϵ , dargestellt als graues Rechteck mit zwei (gelben und grünen) Dreiecken; und von 1 - ϵ bis 1 , erscheint als kleines rotes Dreieck oben rechts.1/2+ϵ1ϵ1

Was das Bild zeigt

Wenn man das untere linke Dreieck in der Figur mit dem unteren linken Quadrat vergleicht und die iid-Annahme für und Y ausnutzt , ist das klarXY

ϵ=Pr(X+Yϵ)<Pr(Xϵ)Pr(Yϵ)=Pr(Xϵ)2.

Beachten Sie, dass die Ungleichung streng ist: Gleichheit ist nicht möglich, da es eine positive Wahrscheinlichkeit gibt, dass sowohl als auch Y kleiner als ϵ sind, aber trotzdem X + Y > ϵ .XYϵX+Y>ϵ

In ähnlicher Weise wird das rote Dreieck mit dem Quadrat in der oberen rechten Ecke verglichen.

ϵ=Pr(X+Y>1ϵ)<Pr(X>1/2ϵ)2.

Schließlich ergibt ein Vergleich der beiden gegenüberliegenden Dreiecke oben links und unten rechts mit dem sie enthaltenden diagonalen Band eine weitere strenge Ungleichung.

2ϵ<2Pr(Xϵ)Pr(X>1/2ϵ)<Pr(1/2ϵ<X+Y1/2+ϵ)=2ϵ.

Die erste Ungleichung ergibt sich aus den vorherigen beiden (nimm ihre Quadratwurzeln und multipliziere sie), während die zweite die (strikte) Einbeziehung der Dreiecke in das Band beschreibt und die letzte Gleichheit die Gleichförmigkeit von ausdrückt . Die Schlussfolgerung, dass 2 ϵ < 2 ϵ der Widerspruch ist, der beweist, dass X und Y nicht existieren können, QED .X+Y2ϵ<2ϵXY

whuber
quelle
3
(+1) Ich mag diesen Ansatz. Als ich meinen Umschlag aus dem Papierkorb holte, konnte ich sehen, dass ich dasselbe Diagramm gezeichnet habe, nur dass ich die gelben und grünen Dreiecke innerhalb des Bandes nicht markiert habe. Ich habe die Ungleichungen für das blaue und das rote Dreieck erhalten. Ich habe mit ihnen und einigen anderen Wahrscheinlichkeiten herumgespielt, aber nie daran gedacht, die Wahrscheinlichkeit des Streifens zu untersuchen, was sich als kritischer Schritt herausstellt. Ich frage mich, welcher Denkprozess diese Einsicht motiviert haben könnte.
Silverfish
In der Tat, wo @whuber gelbe und grüne Dreiecke hat, habe ich auf Quadrate gezeichnet (ich habe effektiv in ein Gitter zerlegt ). Mit Blick auf der Stufe , die "beschreibt die (streng) Aufnahme der Dreiecke innerhalb des Bandes", 2 Pr ( X ε ) Pr ( X > 1 / 2 - ε ) < Pr ( 1 / 2 - ε < X + Y 1 / 2 + ε )[0,0.5]22Pr(Xϵ)Pr(X>1/2ϵ)<Pr(1/2ϵ<X+Y1/2+ϵ)Ich frage mich, ob dies bei Quadraten, die das Band bedecken, geometrisch natürlicher wäre als bei Dreiecken.
Silverfish
1
@Silver Ich wurde an eine Analyse der Summen von Gleichverteilungen erinnert, die ich vor ein paar Jahren gepostet habe. Das schlug vor, die Summe geometrisch zu visualisieren . Es war sofort ersichtlich , dass eine Menge Wahrscheinlichkeit nahe den Ecken konzentriert werden mußte ( 0 , 0 ) und ( 1 / 2 , 1 / 2 ) , um für die Summe gleichförmig zu sein und eine relativ geringe Wahrscheinlichkeit nahe der Mitte diagonal zu sein X + Y = 1 / 2 . Das führte zu dem Diagramm, das ich in Mathematica neu gezeichnet habe .X+Y(0,0)(1/2,1/2)X+Y=1/2Zu diesem Zeitpunkt schrieb sich die Antwort von selbst. Ja, die Verwendung von Quadraten im mittleren Bereich ist möglicherweise besser.
Whuber
Vielen Dank! "Beachten Sie, dass die Ungleichung streng ist: Gleichheit ist nicht möglich, da es eine positive Wahrscheinlichkeit gibt, dass entweder oder Y kleiner als ϵ ist, aber dennoch X + Y > ϵ ." Ich bin mir nicht sicher, ob ich dem folge. Es scheint mir das Ziel zu sein, Pr ( X + Y ϵ ) < Pr ( X ϵ Y ϵ ) zu zeigen . Erfordert dies nicht eine positive Wahrscheinlichkeit für ein Ereignis A, in dem sowohl X als auchXYϵX+Y>ϵPr(X+Yϵ)<Pr(XϵYϵ)A X kleiner oder gleich ϵ ist und dennoch X + Y > ϵYϵX+Y>ϵ ? Es ist das "eine von" gegen "beide von", über die ich schwanke.
Silverfish
@ Silberfisch Danke; Ich habe das nicht so ausgedrückt, wie ich es beabsichtigt hatte. Sie haben Recht: Die Sprache soll im Wesentlichen den Teil eines kleinen Quadrats beschreiben, der sich nicht innerhalb des Dreiecks befindet.
Whuber
10

Ich habe versucht, einen Beweis zu finden, ohne die charakteristischen Funktionen zu berücksichtigen. Übermäßige Kurtosis macht den Trick. Hier ist die zweizeilige Antwort: da X und Y iid sind. Dann impliziert Kurt ( U ) = - 1,2 Kurt ( X ) = - 2,4, was ein Widerspruch zu Kurt ( X ) ist.Kurt(U)=Kurt(X+Y)=Kurt(X)/2XYKurt(U)=1.2Kurt(X)=2.4Kurt(X)2 for any random variable.

XYE(U)=0.5Var(U)=112. If X and Y are identically distributed then we have:

E(X+Y)=E(X)+E(Y)=2E(X)=0.5

So E(X)=0.25. For the variance we additionally need to use independence to apply:

Var(X+Y)=Var(X)+Var(Y)=2Var(X)=112

Hence Var(X)=124 and σX=1260.204. Wow! That is a lot of variation for a random variable whose support ranges from 0 to 0.5. But we should have expected that, since the standard deviation isn't going to scale in the same way that the mean did.

Now, what's the largest standard deviation that a random variable can have if the smallest value it can take is 0, the largest value it can take is 0.5, and the mean is 0.25? Collecting all the probability at two point masses on the extremes, 0.25 away from the mean, would clearly give a standard deviation of 0.25. So our σX is large but not impossible. (I hoped to show that this implied too much probability lay in the tails for X+Y to be uniform, but I couldn't get anywhere with that on the back of an envelope.)

Second moment considerations almost put an impossible constraint on X so let's consider higher moments. What about Pearson's moment coefficient of skewness, γ1=E(XμX)3σX3=κ3κ23/2? This exists since the central moments exist and σX0. It is helpful to know some properties of the cumulants, in particular applying independence and then identical distribution gives:

κi(U)=κi(X+Y)=κi(X)+κi(Y)=2κi(X)

This additivity property is precisely the generalisation of how we dealt with the mean and variance above - indeed, the first and second cumulants are just κ1=μ and κ2=σ2.

Then κ3(U)=2κ3(X) and (κ2(U))3/2=(2κ2(X))3/2=23/2(κ2(X))3/2. The fraction for γ1 cancels to yield Skew(U)=Skew(X+Y)=Skew(X)/2. Since the uniform distribution has zero skewness, so does X, but I can't see how a contradiction arises from this restriction.

So instead, let's try the excess kurtosis, γ2=κ4κ22=E(XμX)4σX43. By a similar argument (this question is self-study, so try it!), we can show this exists and obeys:

Kurt(U)=Kurt(X+Y)=Kurt(X)/2

The uniform distribution has excess kurtosis 1.2 so we require X to have excess kurtosis 2.4. But the smallest possible excess kurtosis is 2, which is achieved by the Binomial(1,12) Bernoulli distribution.

Silverfish
quelle
2
(+1) This is a quite clever approach, which was new to me. Thanks. Note that some of your analysis could have been streamlined by considering a uniform centered at zero. (The equivalence of the problem is immediate.) That would have immediately told you that considering skew was a dead-end.
cardinal
@cardinal: I knew the skew was a dead-end before I worked on it. The purpose was expository: it's a self-study question so I didn't want to solve it in full! Rather I wanted to leave a hint on how to deal with the next level up...
Silverfish
@cardinal: I was in two minds whether to center or not. I did back-of-envelope calculations more conveniently, but in the final analysis we just need (1) a simple case of the general result that Kurt(X1+...+Xn)=1nKurt(X) for iid Xi, (2) that Kurt(U)=1.2 for any uniform distribution, and (3) Kurt(X) exists since X is bounded and σX0 (which is trivial, else σU=0). So none of the key results actually required centering, though bits may have looked less ugly!
Silverfish
Yes, the word "streamlined" was carefully chosen. :-) I did not intend my comment to be read as criticism of your exposition. Cheers.
cardinal
@cardinal Incidentally, variance considerations alone almost worked, but the uniform isn't quite spread out enough. With a bit more probability mass nearer the extremes, e.g. fT(t)=12t2 on [-0.5, 0.5], then Var(T)=.15 and if T=X1+X2 then σX=.15/20.27>0.25 which is impossible as X is bounded by -0.25 and 0.25. Of course, you will see immediately how this relates to the present example! I wonder if the approach generalises, I'm sure other bounded RVs can't be decomposed into sums but require even higher moments investigated to find the contradiction.
Silverfish