Bedingte Erwartung einer einheitlichen Zufallsvariablen bei Auftragsstatistik

8

Es sei angenommen , X = (X1,...,Xn) ~ U(θ,2θ) , wobei θR+ .

Wie berechnet man die bedingte Erwartung von E[X1|X(1),X(n)] , wobei X(1) und X(n) die kleinste bzw. größte Ordnungsstatistik sind?

Mein erster Gedanke wäre, dass die Bestellstatistik den Bereich begrenzt und einfach (X(1)+X(n))/2 , aber ich bin mir nicht sicher, ob dies korrekt ist!

N. Quizitiv
quelle
1
Dieser Beitrag auf Mathe SE könnte hilfreich sein
kjetil b halvorsen

Antworten:

8

Betrachten Sie den Fall einer iid-Stichprobe X1,X2,,Xn aus einer gleichmäßigen Verteilung (0,1) . Das Skalieren dieser Variablen mit θ und das Übersetzen mit θ verleiht ihnen eine gleichmäßige Verteilung (θ,2θ) . Alles, was für dieses Problem relevant ist, ändert sich auf die gleiche Weise: die Auftragsstatistik und die bedingten Erwartungen. Somit gilt die in diesem Sonderfall erhaltene Antwort allgemein.

Sei 1<k<n. Indem Sie die Argumentation unter https://stats.stackexchange.com/a/225990/919 (oder anderswo) emulieren , stellen Sie fest, dass die gemeinsame Verteilung von (X(1),X(k),X(n)) eine Dichtefunktion hat

fk;n(x,y,z)=I(0xyz1)(yx)k2(zy)nk1.

Wenn Sie (x,z) festlegen und dies als Funktion von y, dies als Beta- Verteilung (k1,nk) erkennbar , die skaliert und in das Intervall [x,z]. Der Skalierungsfaktor muss also zx und die Übersetzung dauert 0 bis x.

Da die Erwartung einer Beta (k1,nk) Verteilung ist (k1)/(n1), finden wir , dass die bedingte Erwartung von X(k) muss die skalierte, übersetzt Erwartung sein; nämlich,

E(X(k)X(1),X(n))=X(1)+(X(n)X(1))k1n1.

Die Fälle k=1 und k=n sind trivial: Ihre bedingten Erwartungen sind X(1) bzw. X(k).

Lassen Sie uns die Erwartung der Summe aller Auftragsstatistiken ermitteln:

E(k=1nX(k))=X(1)+k=2n1(X(1)+(X(n)X(1))k1n1)+X(n).

Die Algebra läuft darauf hinaus, die Summe

k=2n1(k1)=(n1)(n2)/2.

Somit

E(k=1nX(k))=(n1)X(1)+(X(n)X(1))(n1)(n2)2(n1)+X(n)=n2(X(n)+X(1)).

Schließlich haben sie, weil die Xi identisch verteilt sind, alle die gleiche Erwartung, woher

nE(X1X(1),X(n))=E(X1)+E(X2)++E(Xn)=E(X(1))+E(X(2))++E(X(n))=n2(X(n)+X(1)),

mit der einzigartigen Lösung

E(X1X(1),X(n))=(X(n)+X(1))/2.


Es ist bemerkenswert, dass dieses Ergebnis nicht nur eine Folge der Symmetrie der gleichmäßigen Verteilung ist, sondern insbesondere für die gleichmäßige Verteilungsfamilie. Betrachten Sie für eine gewisse Intuition Daten, die aus einer Beta (a,a) -Verteilung mit a<1. Die Wahrscheinlichkeiten dieser Verteilung sind nahe 0 und 1 (ihre Dichte hat eine U- oder "Badewannen" -Form). Wenn X(n)<1/2, können wir sicher sein , die meisten Daten sind aufgestapelt Nähe von X(1)und wird daher tendenziell Erwartungen haben, die unter dem Mittelpunkt (X(1)+X(n))/2;und , wenn X(1)>1/2, das Gegenteil passiert , und die meisten der Daten wahrscheinlich nahe an angehäuft X(n).

whuber
quelle
1

Das Folgende ist kein Beweis, sondern eine Überprüfung des gewünschten Ergebnisses, sobald Sie wissen, dass (X(1),X(n)) eine vollständige Statistik für θ :

Gemeinsames PDF von X1,X2,,Xn ist

fθ(x1,,xn)=1θn1θ<x(1),x(n)<2θ=1θn112x(n)<θ<x(1),θR+

So T=(X(1),X(n)) ist eine erschöpfende Statistik für θ . Es kann gezeigt werden, dass T auch eine vollständige Statistik ist, indem man in diese Richtung geht.

Dann nach dem Satz von Lehmann-Scheffe , E[X1T] ist der UMVUE vonE(X1)=3θ2 .

Nun, 1θ(Xiθ)i.i.dU(0,1), so dass1θ(X(n)θ)Beta(n,1)und1θ(X(1)θ)Beta(1,n).

Daher ist E(X(n))=nθn+1+θ=(2n+1)θn+1 undE(X(1))=θn+1+θ=(n+2)θn+1 .

Daher,

E[12(X(1)+X(n))]=12(n+1)((n+2)θ+(2n+1)θ)=3θ2

Dies beweist, dass 12(X(1)+X(n))ist der UMVUE von3&thgr;3θ2 von Lehmann-Scheffe.

Da UMVUE immer dann eindeutig ist, wenn es existiert, überprüft es die Behauptung, dass E[X1T]=12(X(1)+X(n)).

HartnäckigAtom
quelle
+1 Diese Antwort ist schön, weil sie einen tieferen Weg aufzeigt, die Übung zu verstehen und was sie uns lehren kann.
whuber