Unabhängigkeits- und Ordnungsstatistik

8

Ich habe ein Problem zur Hand, mit dem ich nicht fortfahren kann. Kann mir jemand helfen zu beginnen?

f ( x ) = 2 x 0 < x < 1 U 1 = Y 1Y1<Y2<Y3 : Eine Auftragsstatistik der Größe 3 aus der Verteilung mit pdf Definieren Sie außerdem Die Aufgabe besteht darin, das gemeinsame PDF von zu berechnen .

f(x)=2x   0<x<1
U1=Y1Y2  and    U2=Y2Y3
U1 & U2

Meine Arbeit: Ich habe den Rand von .U1 & U2

P ( U 2U 2 ) = 1 0u 2 y 3 0 f Y 2 , Y 3

P(U1u1)=010u1y2fY1,Y2(y1,y2)dy1dy2
P(U2u2)=010u2y3fY2,Y3(y2,y3)dy2dy3
Welchen Schritt soll ich als nächstes tun?
Qwerty
quelle

Antworten:

10

Hier ist eine Anleitung zur Lösung dieses Problems (und anderer, die es mögen). Ich verwende simulierte Werte zur Veranschaulichung. Beginnen wir also damit, eine große Anzahl unabhängiger Realisierungen aus der Verteilung mit der Dichte simulieren . (Der gesamte Code in dieser Antwort ist in geschrieben .)fR

n <- 4e4 # Number of trials in the simulation
x <- matrix(pmax(runif(n*3), runif(n*3)), nrow=3)

# Plot the data
par(mfrow=c(1,3))
for (i in 1:3) {
  hist(x[i, ], freq=FALSE, main=paste("i =", i))
  curve(f(x), add=TRUE, col="Red", lwd=2)
}

Histogramme der Originaldaten

Die Histogramme zeigen unabhängige Realisierungen des ersten, zweiten und dritten Elements der Datensätze. Das rote Kurvendiagramm . Dass sie mit den Histogrammen übereinstimmen, bestätigt, dass die Simulation wie beabsichtigt funktioniert.f40,000f

Sie müssen die Verbindungsdichte von . (Y1,Y2,Y3)Da Sie die Auftragsstatistik studieren, sollte dies Routine sein - aber der Code gibt einige Hinweise, da er ihre Verteilungen als Referenz darstellt.

y <- apply(x, 2, sort)

# Plot the order statistics.
f <- function(x) 2*x
ff <- function(x) x^2
for (i in 1:3) {
  hist(y[i, ], freq=FALSE, main=paste("i =", i))
  k <- factorial(3) / (factorial(3-i)*factorial(1)*factorial(i-1))
  curve(k * (1-ff(x))^(3-i) * f(x) * ff(x)^(i-1), add=TRUE, col="Red", lwd=2)
}

Histogramme der Auftragsstatistik

In jedem der Datensätze wurden dieselben Daten neu angeordnet . Links ist das Histogramm ihrer Minima , rechts ihre Maxima und in der Mitte ihre Mediane .Y 1 Y 3 Y 240,000Y1Y3Y2

Berechnen Sie als nächstes direkt die gemeinsame Verteilung von . (U1,U2) Per Definition ist dies

F(u1,u2)=Pr(U1u1,U2u2)=Pr(Y1u1Y2,Y2u2Y3).

Da Sie die von berechnet haben , ist dies eine Routine, das (dreifache) Integral das durch die Wahrscheinlichkeit für die rechte Hand ausgedrückt wird. Der Integrationsbereich muss(Y1,Y2,Y3)

0Y1u1Y2, 0Y2u2Y3, 0Y31.

Die Simulation kann uns einen Hinweis darauf geben, wie verteilt sind: Hier ist ein Streudiagramm der realisierten Werte von . Ihre theoretische Antwort sollte diese Dichte beschreiben.(U1,U2)(U1,U2)

par(mfrow=c(1,1))
u <- cbind(y[1, ]/y[2, ], y[2, ]/y[3, ])
plot(u, pch=16, cex=1/2, col="#00000008", asp=1)

Streudiagramm

Zur Kontrolle können wir uns die Randverteilungen ansehen und sie mit den theoretischen Lösungen vergleichen. Die als rote Kurven dargestellten Randdichten werden als und .F(u1,1)/u1F(1,u2)/u2

par(mfrow=c(1,2))
hist(u[, 1], freq=FALSE); curve(2*x, add=TRUE, col="Red", lwd=2)
hist(u[, 2], freq=FALSE); curve(4*x^3, add=TRUE, col="Red", lwd=2)
par(mfrow=c(1,1))

Histogramme von U_1 und U_2

Es ist merkwürdig, dass die gleiche Verteilung wie das ursprüngliche .U1Xi

whuber
quelle
3

Hier ist eine exakte symbolische Lösung, die die erforderlichen Schritte nachzeichnet ... hier mit automatisierten Werkzeugen, um die Kleinigkeiten zu erledigen

Es sei eine Stichprobe der Größe 3 aus dem übergeordneten PDF :(X1,X2,X3)f(x)

Geben Sie hier die Bildbeschreibung ein

Dann lautet das gemeinsame PDF der geordneten Stichprobe :(X(1),X(2),X(3))g(x1,x2,x3)

Geben Sie hier die Bildbeschreibung ein

wo ich die OrderStatFunktion aus dem mathStatica- Paket für Mathematica verwende .

Das gemeinsame cdf von ist :(U1,U2)P(X(1)X(2)<u1,X(2)X(3)<u2)

Geben Sie hier die Bildbeschreibung ein

Das gemeinsame PDF von wird durch einfaches Differenzieren des cdf für und :(U1,U2)u1u2

Geben Sie hier die Bildbeschreibung ein

Als kurze Monte-Carlo-Überprüfung hier ein Vergleich von:

  • die genaue theoretische Lösung abgeleitet (das gemeinsame PDF - die orange Oberfläche)

  • aufgetragen gegen ein empirisches Monte-Carlo-simuliertes gemeinsames PDF (3D-Histogramm):

Geben Sie hier die Bildbeschreibung ein

Wölfe
quelle