Auf Seite 180 von Robust Statistics: Der auf Einflussfunktionen basierende Ansatz findet sich folgende Frage:
- 16: Zeigen Sie, dass für ortsinvariante Schätzer immer . Finden Sie die entsprechende Obergrenze für den Finite-Sample-Breakdown-Punkt , sowohl für den Fall, dassungerade oderist.
Der zweite Teil (nach dem Punkt) ist eigentlich trivial (angesichts des ersten), aber ich kann keinen Weg finden, den ersten Teil (Satz) der Frage zu beweisen.
In dem Abschnitt des Buches, der sich auf diese Frage bezieht, findet man (S. 98):
wobei die Stichprobe erhalten wird, indem Datenpunkte durch beliebige Werte m y 1 , … , y m .
Die formale Definition von selbst läuft fast eine Seite, kann aber als Obwohl nicht explizit definiert, eine kann erraten, dass bedeutet, dass erfüllen muss ε * = lim n → ∞ ε * n T n T n ( x 1 , ... , x n ) = T n ( x 1 + c , ... , x n + c ) , für alle c ∈ R
Ich beantworte Whubers Frage im Kommentar unten. Das Buch definiert, dass der Schätzer mehrere Seiten umfasst. Ab Seite 82 versuche ich, die Hauptteile zu reproduzieren (ich denke, es wird die Frage von Whuber beantworten):
Angenommen, wir haben eindimensionale Beobachtungen die unabhängig und identisch verteilt sind (iid). Die Beobachtungen gehören zu einem Probenraum , der eine Teilmenge der realen Linie (häufig entspricht einfach selbst, sodass die Beobachtungen einen beliebigen Wert annehmen können ). Ein parametrisches Modell besteht aus einer Familie von Wahrscheinlichkeitsverteilungen im Probenraum, wobei der unbekannte Parameter zu einem ParameterraumH R H R F θ θ Θ
...
Wir identifizieren die Probe mit ihrer empirischen Verteilung und ignorieren dabei die Reihenfolge der Beobachtungen (wie fast immer). Formal ist gegeben durch wobei die Punktmasse 1 in . Als Schätzer von wir reelle Statistiken . Im weiteren Sinne kann ein Schätzer als eine Folge von Statistiken , eine für jede mögliche Stichprobengröße . Im Idealfall werden die Beobachtungen gemäß einem Mitglied des parametrischen Modells iid G n G n ( 1 / n ) ∑ n i = 1 Δ x i Δ X X θ T n = T n ( X 1 , … , X n ) = T n ( G n ) { T n , n ≥ 1 } n {F ( H ) H. , aber die Klasse aller möglichen Wahrscheinlichkeitsverteilungen auf ist viel größer.
Wir betrachten Schätzer, die Funktionale sind [dh für alle und ] oder asymptotisch durch Funktionale ersetzt werden können. Dies bedeutet, dass wir annehmen, dass es ein funktionales [wobei die Domäne von die Menge aller Verteilungen für die definiert ist], so dass in der Wahrscheinlichkeit, wenn die Beobachtungen gemäß der wahren Verteilung in iid sind . Wir sagen, dassn G n T : Domäne ( T ) → R T F ( H ) T T n ( X 1 , … , X n ) → n → ∞ T ( G ) G- Domäne ( T ) T ( G ) { T n
der asymptotische Wert ist bei .G.
...
In diesem Kapitel nehmen wir immer an, dass die untersuchten Funktionale Fisher-konsistent sind (Kallianpur und Rao, 1955): was bedeutet, dass bei Das Modell des Schätzers misst asymptotisch die richtige Größe. Der Begriff der Fisher-Konsistenz ist für Funktionale geeigneter und eleganter als die übliche Konsistenz oder asymptotische Unparteilichkeit.{ T n ; n ≥ 1 }
quelle
Antworten:
Ältere Statistikbücher verwendeten "invariant" auf etwas andere Weise als erwartet; Die mehrdeutige Terminologie bleibt bestehen. Ein moderneres Äquivalent ist "äquivariant" (siehe die Referenzen am Ende dieses Beitrags). Im vorliegenden Zusammenhang bedeutet es
für alle echten .c
Um die Frage zu beantworten, nehmen wir an, dass die Eigenschaft hat, dass für ausreichend großes alle reellen und alle ,Tn n c m≤ε∗n
wann immer von um höchstens in höchstens Koordinaten abweicht .Y X c m
(Dies ist eine schwächere Bedingung als in der Definition der Aufschlüsselungsgrenze angenommen. Tatsächlich müssen wir nur annehmen, dass der Ausdruck " " , wenn ausreichend groß ist, ein Wert ist, der garantiert kleiner als ist groß.)n o(|c|) |c|/2
Der Beweis ist im Widerspruch. Nehmen Sie dementsprechend an, dass dieses auch äquivariante ist, und nehmen Sie . Dann für hinreichend große , eine ganze Zahl ist, für die sowohl und . Für alle reellen Zahlen definierenTn ε∗>1/2 n m(n)=⌊ε∗n⌋ m(n)/n≤ε∗ (n−m(n))/n≤ε∗ a,b
wo es 's und ' s gibt. Durch Ändern von oder weniger der Koordinaten schließen wir beidem(n) a n−m(n) b m(n)
und
Für die Dreiecksungleichung behauptetc>0
Die strikte Ungleichung auf der vorletzten Linie ist für ausreichend großes gewährleistet . Der damit verbundene Widerspruch beweistn c<c ε∗≤1/2.
Verweise
EL Lehmann, Theorie der Punktschätzung . John Wiley 1983.
Im Text (Kapitel 3, Abschnitt 1) und einer dazugehörigen Fußnote schreibt Lehmann
quelle