Das pdf von

15

Angenommen , X1,X2,...,Xn sei iid aus N(μ,σ2) mit unbekanntem μR und σ2>0

Sei Z=X1X¯S,S ist hier die Standardabweichung.

Es kann gezeigt werden, dass Z die Lebesgue pdf hat

f(z)=nΓ(n-12)π(n-1)Γ(n-22)[1-nz2(n-1)2]n/2-2ich(0,(n-1)/n)(|Z|)

Meine Frage ist dann, wie man dieses pdf erhält?

Die Frage ist von hier in Beispiel 3.3.4, um den UMVUE von P(X1c) . Ich kann die Logik und Prozeduren verstehen, um das UMVUE zu finden, weiß aber nicht, wie ich das PDF erhalten soll.

Ich denke , diese Frage auch auf diese beziehen sich ein

Vielen Dank für die Hilfe oder den Hinweis auf verwandte Referenzen werden ebenfalls angeeignet.

Tiefer Norden
quelle

Antworten:

14

Das Faszinierende an diesem Ergebnis ist, wie sehr es nach der Verteilung eines Korrelationskoeffizienten aussieht. Es gibt einen Grund.


Angenommen, ist bivariate Normale mit Nullkorrelation und gemeinsamer Varianz σ 2 für beide Variablen. Zeichnen Sie eine iid-Probe ( x 1 , y 1 ) , , ( x n , y n ) . Es ist allgemein bekannt und geometrisch leicht zu bestimmen (wie Fisher es vor einem Jahrhundert getan hat), dass die Verteilung des Probenkorrelationskoeffizienten(X,Y)σ2(x1,y1),,(xn,yn)

r=i=1n(xix¯)(yiy¯)(n1)SxSy

ist

f(r)=1B(12,n2-1)(1-r2)n/2-2, -1r1.

(Hier sind wie üblich und usual y Abtastmittel und S x und S y sind die Quadratwurzeln der unverzerrten Varianzschätzer.) B ist die Beta-Funktion , für diex¯y¯SxSyB

(1)1B(12,n21)=Γ(n12)Γ(12)Γ(n21)=Γ(n12)πΓ(n21).

Um zu berechnen , können wir seine Invarianz unter Rotationen in R n um die durch ( 1 , 1 , , 1 ) erzeugte Linie zusammen mit der Invarianz der Verteilung der Stichprobe unter denselben Rotationen ausnutzen und y i / S wählen y ist ein beliebiger Einheitsvektor, dessen Komponenten sich zu Null addieren. Ein solcher Vektor ist proportional zu v = ( n - 1 , - 1 , ... , - 1 ) . Seine Standardabweichung istrRn(1,1,,1)yi/Syv=(n1,1,,1)

Sv=1n1((n1)2+(1)2++(1)2)=n.

Folglich muss die gleiche Verteilung haben wier

i=1n(xix¯)(viv¯)(n1)SxSv=(n1)x1x2xn(n1)Sxn=n(x1x¯)(n1)Sxn=nn1Z.

Daher brauchen wir nur zu skalieren , um die Verteilung von Z zu finden :rZ

fZ(z)=|nn1|f(nn1z)=1B(12,n21)nn1(1n(n1)2z2)n/22

für . Die Formel (1) zeigt, dass dies mit dem der Frage identisch ist.|z|n1n


Nicht ganz überzeugt? Hier ist das Ergebnis der 100.000-fachen Simulation dieser Situation (mit , wobei die Verteilung gleichmäßig ist).n=4

Zahl

Das erste Histogramm zeigt die Korrelationskoeffizienten von während das zweite Histogramm die Korrelationskoeffizienten von ( x i , v i ) , i = 1 , , 4 ) für a darstellt zufällig gewählter Vektor v i , der für alle Iterationen fest bleibt. Sie sind beide einheitlich. Das QQ-Diagramm auf der rechten Seite bestätigt, dass diese Verteilungen im Wesentlichen identisch sind.(xi,yi),i=1,,4(xi,vi),i=1,,4) vi

Hier ist der RCode, der die Handlung erzeugt hat.

n <- 4
n.sim <- 1e5
set.seed(17)
par(mfrow=c(1,3))
#
# Simulate spherical bivariate normal samples of size n each.
#
x <- matrix(rnorm(n.sim*n), n)
y <- matrix(rnorm(n.sim*n), n)
#
# Look at the distribution of the correlation of `x` and `y`.
#
sim <- sapply(1:n.sim, function(i) cor(x[,i], y[,i]))
hist(sim)
#
# Specify *any* fixed vector in place of `y`.
#
v <- c(n-1, rep(-1, n-1)) # The case in question
v <- rnorm(n)             # Can use anything you want
#
# Look at the distribution of the correlation of `x` with `v`.
#
sim2 <- sapply(1:n.sim, function(i) cor(x[,i], v))
hist(sim2)
#
# Compare the two distributions.
#
qqplot(sim, sim2, main="QQ Plot")

Referenz

RA Fisher, Häufigkeitsverteilung der Werte des Korrelationskoeffizienten in Stichproben einer unbegrenzt großen Population . Biometrika , 10 , 507. Siehe Abschnitt 3. (Zitiert in Kendalls Advanced Theory of Statistics , 5. Aufl., Abschnitt 16.24.)

whuber
quelle
Die Verknüpfung zur Referenz ist unterbrochen.
Sextus Empiricus
@ Martijn Vielen Dank für die Prüfung. Ich verstehe, was Sie meinen - der Link funktioniert, aber es geht um nichts Relevantes! Ich habe es repariert.
Whuber
4

Ich möchte diesen Weg vorschlagen, um das PDF von Z durch direkte Berechnung des MVUE von Verwendung des Bayes-Theorems zu erhalten, obwohl es handvoll und komplex ist.P(Xc)

Da und Z 1 = ˉ X , Z 2 = S 2 sind gemeinsame vollständige erschöpfende Statistik, MVUE von P ( X c ) würde sei so:E[I(,c)(X1)]=P(X1c)Z1=X¯Z2=S2P(Xc)

ψ(z1,z2)=E[I(,c)(X1)|z1,z2]=I(,c)fX|Z1,Z2(x1|z1,z2)dx1

Mit dem Satz von Bayes erhalten wir

fX|Z1,Z2(x1|z1,z2)=fZ1,Z2|X1(z1,z2|x1)fX1(x1)fZ1,Z2(z1,z2)

Der Nenner kann in geschlossener Form geschrieben werden, weilZ1N(μ, σ 2) istfZ1,Z2(z1,z2)=fZ1(z1)fZ2(z2),Z2( n - 1Z1N(μ,σ2n)sind voneinander unabhängig.Z2Γ(n12,2σ2n1)

Um die geschlossene Form des Zählers zu erhalten, können wir diese Statistik übernehmen: W2= n i = 2 × 2 i -(n-1)W 2 1

W1=i=2nXin1
W2=i=2nXi2(n1)W12(n1)1

welches der Mittelwert und die Stichprobenvarianz von X2,X3,...,XnX1Z1,Z2

W1=nZ1-X1n-1W2=(n-1)Z2+nZ12-X12-(n-1)W12n-2

X1=x1

fZ1,Z2|X1(z1,z2|x1)=nn-2fW1,W2(w1,w2)=nn-2fW1(w1)fW2(w2)

Schon seit W1N(μ,σ2n-1), W2Γ(n-22,2σ2n-2)wir können die geschlossene Form davon bekommen. Beachten Sie, dass dies nur für giltw20 was einschränkt x1 zu z1n1nz2x1z1+n1nz2.

So put them all together, exponential terms would disappear and you'd get,

fX|Z1,Z2(x1|z1,z2)=Γ(n12)πΓ(n22)nz2(n1)(1(n(x1z1)z2(n1))2)
where z1n1nz2x1z1+n1nz2 and zero elsewhere.

From this,at this point, we can get the pdf of Z=X1z1z2 using transformation.

By the way, the MVUE would be like this :

ψ(z1,z2)=Γ(n12)πΓ(n22)π2θccosn3θdθ
while θc=sin1(n(cz1)(n1)z1) and would be 1 if cz1+n1nz2

I am not a native English speaker and there could be some awkward sentences. I am studying statistics by myself with text book introduction to mathmatical statistics by Hogg. So there could be some grammatical or mathmatical conceptual mistakes. It would be appreciated if someone correct them.

Thank you for reading.

KDG
quelle