Ausreichende Statistik gemeinsam vervollständigen: Uniform (a, b)

12

Sei X=(x1,x2,xn) eine Zufallsstichprobe aus der Gleichverteilung auf (a,b) , wobei a<b . Sei Y1 und Yn die Statistik der größten und kleinsten Ordnung. Zeigen Sie, dass die Statistik (Y1,Yn) eine gemeinsam vollständige ausreichende Statistik für den Parameter θ=(a,b).

Es ist für mich kein Problem, durch Faktorisierung eine ausreichende Leistung zu erbringen.

Frage: Wie zeige ich Vollständigkeit? Am liebsten hätte ich einen Tipp.

Versuch: Ich kann zeigen, dass E[g(T(x))]=0 bedeutet, dass g(T(x))=0 für die Gleichverteilung mit einem Parameter ist, aber ich bleibe bei der Gleichverteilung mit zwei Parametern.

Ich habe versucht, mit E[g(Y1,Yn)] und die gemeinsame Verteilung von Y1 und Yn , bin mir aber nicht sicher, ob ich in die richtige Richtung gehe, da der Kalkül mich auslöst.

emlu
quelle
1
Bitte füge den [self-study]Tag hinzu und lies das Wiki . Beachten Sie, dass Sie die Latex-Formatierung für mathematische Berechnungen verwenden können, indem Sie US-Dollar in Umlauf bringen, z . B. x$x$ erzeugen . Ich habe versucht, einen Teil Ihrer Mathematik zu setzen, kann mich aber jederzeit ändern oder zurücksetzen, wenn Sie mit dem Ergebnis nicht zufrieden sind. Sie könnten die Schreibweise bevorzugen für x statt für x . x$\vec x$x$\mathbf x$x
Silverfish

Antworten:

4

Lassen Sie uns die Routinekalkulation für Sie erledigen, damit Sie das Problem auf den Punkt bringen und Spaß daran haben, eine Lösung zu formulieren. Es kommt darauf an, Rechtecke als Vereinigungen und Unterschiede von Dreiecken zu konstruieren.

Wählen Sie zuerst die Werte von und b , die die Details so einfach wie möglich machen. ab Ich mag : Die univariate Dichte jeder Komponente von X = ( X 1 , X 2 , , X n ) ist nur die Indikatorfunktion des Intervalls [ 0 , 1 ] .a=0,b=1X=(X1,X2,,Xn)[0,1]

Finden wir die Verteilungsfunktion von ( Y 1 , Y n ) . F(Y1,Yn)Per Definition ist für beliebige reelle Zahlen das isty1yn

(1)F(y1,yn)=Pr(Y1y1 and Ynyn).

Die Werte von sind offensichtlich 0 oder 1, falls y 1 oder y n außerhalb des Intervalls [ a , b ] = [ 0 , 1 ] liegen . Nehmen wir also an, dass beide Werte in diesem Intervall liegen. (Nehmen wir auch an, dass n 2 ist , um Trivialitäten nicht zu diskutieren.) In diesem Fall kann das Ereignis ( 1 ) mit den ursprünglichen Variablen X = ( X 1 , X 2 , ...) beschrieben werden.F01y1yn[a,b]=[0,1]n2(1) als "mindestens eines der X i ist kleiner als oder gleich y 1 und keines der X i überschreitet y n ." Entsprechendliegenalle X i in [ 0 , y n ], aber es ist nicht der Fall, dass alle von ihnen in ( y 1 , y n ] liegen . X=(X1,X2,,Xn)Xiy1XiynXi[0,yn](y1,yn]

Da die unabhängig sind, multiplizieren sich ihre Wahrscheinlichkeiten und ergeben ( y n - 0 ) n = y n n bzw. ( y n - y 1 ) n für diese beiden gerade erwähnten Ereignisse. Somit,Xi(yn0)n=ynn(yny1)n

F(y1,yn)=ynn(yny1)n.

Die Dichte ist die gemischte partielle Ableitung von F ,fF

f(y1,yn)=2Fy1yn(y1,yn)=n(n1)(yny1)n2.

Der allgemeine Fall für skaliert die Variablen um den Faktor b - a und verschiebt die Position um a . (a,b)baa So kann ,a<y1yn<b

F(y1,yn;a,b)=((ynaba)n(ynabay1aba)n)=(yna)n(yny1)n(ba)n.

Differentiating as before we obtain

f(y1,yn;a,b)=n(n1)(ba)n(yny1)n2.

Consider the definition of completeness. Let g be any measurable function of two real variables. By definition,

(2)E[g(Y1,Yn)]=y1babg(y1,yn)f(y1,yn)dy1dyny1babg(y1,yn)(yny1)n2dy1dyn.

We need to show that when this expectation is zero for all (a,b), then it's certain that g=0 for any (a,b).

Here's your hint. Let h:R2R be any measurable function. I would like to express it in the form suggested by (2) as h(x,y)=g(x,y)(yx)n2. To do that, obviously we must divide h by (yx)n2. Unfortunately, for n>2 this isn't defined whenever yx. The key is that this set has measure zero so we can neglect it.

Accordingly, given any measurable h, define

g(x,y)={h(x,y)/(yx)n2xy0x=y

Then (2) becomes

(3)y1babh(y1,yn)dy1dynE[g(Y1,Yn)].

(When the task is showing that something is zero, we may ignore nonzero constants of proportionality. Here, I have dropped n(n1)/(ba)n2 from the left hand side.)

This is an integral over a right triangle with hypotenuse extending from (a,a) to (b,b) and vertex at (a,b). Let's denote such a triangle Δ(a,b).

Ergo, what you need to show is that if the integral of an arbitrary measurable function h over all triangles Δ(a,b) is zero, then for any a<b, h(x,y)=0 (almost surely) for all (x,y)Δ(a,b).

Although it might seem we haven't gotten any further, consider any rectangle [u1,u2]×[v1,v2] wholly contained in the half-plane y>x. It can be expressed in terms of triangles:

[u1,u2]×[v1,v2]=Δ(u1,v2)(Δ(u1,v1)Δ(u2,v2))Δ(u2,v1).

Figure showing the three triangles overlapping to produce the rectangle

In this figure, the rectangle is what is left over from the big triangle when we remove the overlapping red and green triangles (which double counts their brown intersection) and then replace their intersection.

Consequently, you may immediately deduce that the integral of h over all such rectangles is zero. It remains only to show that h(x,y) must be zero (apart from its values on some set of measure zero) whenever y>x. The proof of this (intuitively clear) assertion depends on what approach you want to take to the definition of integration.

whuber
quelle
I tried to set equation 3 equal to zero, take the derivative on both sides and interchange the signs (a reflex action I guess) but the results look quite scary [1]. Is there a more reasonable approach? [1] en.wikipedia.org/wiki/Leibniz_integral_rule#Higher_dimensions
mugen
1
Consider finite collections of smaller and smaller triangles all lying along the hypotenuse in the picture and take the limit as the diameter of the largest triangle in the collection goes to zero.
whuber