Verteilung des Verhältnisses abhängiger Chi-Quadrat-Zufallsvariablen

11

Angenommen, X=X1+X2++Xn wobei XiN(0,σ2) unabhängig sind.

Meine Frage ist, was Distribution macht

Z=X2X12+X22++Xn2

Folgen? Ich weiß von hier, dass das Verhältnis zweier Chi-Quadrat-Zufallsvariablen als W ausgedrückt wirdWW+Y folgt einer Beta-Verteilung. Ich denke, dass dies die Unabhängigkeit zwischenWundvoraussetztY. In meinem Fallenthält derNenner vonZdie Komponenten vonXQuadrat.

Ich denke, Z muss auch einer Variation der Beta-Distribution folgen, bin mir aber nicht sicher. Und wenn diese Annahme richtig ist, weiß ich nicht, wie ich es beweisen soll.

x0dros
quelle
6
Da die Verteilung des Nenners bei Rotationen unveränderlich ist, können Sie auf drehenX, was Ihre Frage auf etwas Vertrautes reduziert :-). nX1
whuber
1
Ich bin mir ziemlich sicher, dass @whuber genau das bedeutet, was dort eingegeben wurde. Wenn Sie "Nominator" sagen, meinen Sie "Zähler"?
Glen_b -State Monica am
3
Wenn Sie etwas drehen, behalten Sie (per Definition) seine Länge bei. Daher muss die Varianz einer gedrehten Version von gleich der Varianz von X sein , die 1 + 1 + + istXX : dort ist das1+1++1=n Begriff kommt von. n
whuber
1
@whuber Deine Antwort scheint in der Tat sehr interessant zu sein, aber ich habe einige Zweifel. Wenn Sie sagen, dass ich drehen kann , um gleich √ zu werdenXbedeutet dies im Grunde, dass ich den Zähler vonZalsnX 2 1 umschreiben kannund folglichZselbst zun X 2 1 wirdnX1ZnX12Z . Wenn ich nunW=X 2 1 undY=X 2 2 ++X 2 n annehmeundWundYunabhängig sind, kann ich annehmen, dassZ.nX12X12+X22++Xn2W=X12Y=X22++Xn2WY hat eineβ-Verteilung und so weiter. Verstehe ich Ihren Standpunkt bis jetzt? Also, hier ist meine Verwirrung. VorVerwendung des Begriffs Drehinvarianz und modifyiZ=nWW+Yβ
ssah
2
@ssah Sie irren sich in Ihrer Anwendung meiner Argumentation: Ohne das im Nenner ist seine Verteilung nicht länger unveränderlich für willkürliche Rotationen von ( X 1 , , X n ) , und daher gelten die Schlussfolgerungen nicht mehr. X12(X1,,Xn),
whuber

Antworten:

7

In diesem Beitrag werden die Antworten in den Kommentaren zur Frage erläutert.


Sei . Fixiere jedes e 1R n der Längeneinheit. Ein solcher Vektor kann immer orthonormal vervollständigt werden ( e 1 , e 2 , , e n ) ( zum Beispiel mittels des Gram-Schmidt-Prozesses ). Diese Änderung der Basis (von der üblichen) ist orthogonal: Sie ändert die Längen nicht. So ist die Verteilung vonX=(X1,X2,,Xn)e1Rn(e1,e2,,en)

(e1X)2||X||2=(e1X)2X12+X22++Xn2

hängt nicht von . Die Annahme von e 1 = ( 1 , 0 , 0 , , 0 ) zeigt, dass dies die gleiche Verteilung wie hate1e1=(1,0,0,,0)

(1)X12X12+X22++Xn2.

Da der Normale iid werden, können sie geschrieben werden als σ - mal iid Standard - Normalvariablen Y 1 , ... , Y n und deren Quadrate sind σ 2 mal Γ ( 1 / 2 ) Verteilungen. Da die Summe von n - 1 unabhängig Γ ( 1 / 2 ) Verteilungen ist Γ ( ( n - 1 ) / 2 )XiσY1,,Ynσ2Γ(1/2)n1Γ(1/2)Γ((n1)/2)haben wir festgestellt, dass die Verteilung von (1) is that of

σ2Uσ2U+σ2V=UU+V

U=X12/σ2Γ(1/2)V=(X22++Xn2)/σ2Γ((n1)/2) are independent. It is well known that this ratio has a Beta(1/2,(n1)/2) distribution. (Also see the closely related thread at Distribution of XY if X Beta(1,K1) and Y chi-squared with 2K degrees.)

Since

X1++Xn=(1,1,,1)(X1,X2,,Xn)=ne1X

for the unit vector e1=(1,1,,1)/n, we conclude that Z is (n)2=n times a Beta(1/2,(n1)/2) variate. For n2 it therefore has density function

fZ(z)=n1n/2B(12,n12)(nz)n3z

on the interval (0,n) (and otherwise is zero).


As a check, I simulated 100,000 independent realizations of Z for σ=1 and n=2,3,10, plotted their histograms, and superimposed the graph of the corresponding Beta density (in red). The agreements are excellent.

Figure

Here is the R code. It carries out the simulation by means of the formula sum(x)^2 / sum(x^2) for Z, where x is a vector of length n generated by rnorm. The rest is just looping (for, apply) and plotting (hist, curve).

for (n in c(2, 3, 10)) {
  z <- apply(matrix(rnorm(n*1e5), nrow=n), 2, function(x) sum(x)^2 / sum(x^2))
  hist(z, freq=FALSE, breaks=seq(0, n, length.out=50), main=paste("n =", n), xlab="Z")
  curve(dbeta(x/n, 1/2, (n-1)/2)/n, add=TRUE, col="Red", lwd=2)
}
whuber
quelle