Wir gehen davon aus, dass unsere Statistik eine Funktion einiger Daten ist, die aus der Verteilungsfunktion . Die empirische Verteilungsfunktion unserer Stichprobe ist . So ist die Statistik als Zufallsvariable betrachtet und wird die Bootstrap - Version der Statistik. Wir verwenden als KS-AbstandX 1 , ... X n F F θ ( F ) θ ( F ) d ∞
Es gibt "wenn und nur wenn" Ergebnisse für die Gültigkeit des Bootstraps, wenn die Statistik eine einfache lineare Statistik ist. Zum Beispiel Satz 1 von Mammen "Wann funktioniert der Bootstrap?"
Wenn für eine beliebige Funktion dann funktioniert der Bootstrap in dem Sinne, dass if and nur wenn es und so dass Wobei wir als eine Funktion unserer Stichprobe definieren können undhnd∞[L(θ( F ) - t n),L(θ(F)-tn)]→p0σntnd∞[L(θ(F)-tn)
^ t n t n = E ( t n )
Es gibt auch allgemeinere Ergebnisse, die der Bootstrap für allgemeine Statistiken verwendet, zum Beispiel Satz 1.6.3 aus Subsampling von Politis Romano und Wolf:
Angenommen, wird aus der Klasse aller Verteilungen mit endlicher Unterstützung gezogen. Angenommen, die Statistik ist Frechet, das bei in Bezug auf die Oberste Norm differenzierbar ist, und die Ableitung g_F erfüllt . Dann ist asymptotisch normal und der Bootstrap funktioniert im Sinne des vorhergehenden Satzes.
Ich möchte eine "wenn und nur wenn" -Version des zweiten Theorems. Dies erfordert einen Begriff der Glätte, der sich von der Differenzierbarkeit nach Frechet unterscheidet, da Politis, Romano und Wolf (1999) zeigen, dass der Stichprobenmedian nicht nach Frechet differenzierbar ist, der Bootstrap jedoch weiterhin funktioniert. Der Stichprobenmedian ist jedoch immer noch eine glatte Funktion der Daten.
Es gibt einige informelle Kommentare in Mammen, dass Geschmeidigkeit notwendig ist:
Typischerweise scheint eine lokale asymptotische Linearität für die Konsistenz des Bootstraps notwendig zu sein
Das Zitat lautet:
van Zwet, W. (1989). Vortrag auf der Konferenz "Asymptotische Methoden für computerintensive Verfahren in der Statistik" in Olberwolfach.
Aber ich kann keine Spur von diesem Vortrag finden, abgesehen von ein paar Zitaten.
Antworten:
Sie benötigen die Hadamard-Differenzierbarkeit (oder die kompakte Differenzierbarkeit in Abhängigkeit von Ihrer Referenzquelle) als ausreichende Bedingung, damit in diesem Fall der Bootstrap funktioniert. Der Median und jedes Quantil ist nach Hadamard differenzierbar. Die Differenzierbarkeit von Bruchstücken ist in den meisten Anwendungen zu stark.
Da es normalerweise ausreicht, einen polnischen Raum zu diskutieren, möchten Sie, dass eine lokal lineare Funktion ein typisches Kompaktheitsargument anwendet, um Ihr Konsistenzergebnis auf die globale Situation auszudehnen. Siehe auch den Kommentar zur Linearisierung weiter unten.
Satz 2.27 von [Wasserman] gibt Ihnen eine Vorstellung davon, wie das Hadamard-Derivat eine schwächere Vorstellung ist. Und Theorem 3.6 und 3.7 von [Shao & Tu] geben ausreichende Bedingungen für eine schwache Konsistenz hinsichtlich der Hadamard-Differenzierbarkeit der statistischen Funktion mit der Beobachtungsgröße .T n nρ Tn n
[Shao & Tu] S. 85-86 veranschaulichten Situationen, in denen Inkonsistenzen von Bootstrap-Schätzern auftreten können.
Und in Abschnitt 3.5.2 von [Shao & Tu] haben sie das Quantilbeispiel mit einem Glättungskern überarbeitet . Beachten Sie, dass Momente lineare Funktionale sind. Das Zitat in Ihrer Frage "Typischerweise scheint eine lokale asymptotische Linearität für die Konsistenz des Bootstraps erforderlich zu sein" erfordert ein gewisses Maß an Analytizität des Funktionalen. Dies kann erforderlich sein, da Sie bei einem Fehlschlagen einen pathologischen Fall erstellen können wie die Weierstraß-Funktion (die kontinuierlich und doch nirgends differenzierbar ist).K
In Bezug auf den Kommentar "Typischerweise scheint eine lokale asymptotische Linearität für die Konsistenz des Bootstraps erforderlich zu sein", den Mammen, wie Sie erwähnt haben, gemacht hat. Ein Kommentar von [Shao & Tu] S.78 lautet wie folgt, da sie kommentierten, dass die (globale) Linearisierung nur eine Technik ist, die den Nachweis der Konsistenz erleichtert und keine Notwendigkeit anzeigt:
Und sie gaben ein Beispiel 3.3 zum Abrufen der Bootstrap-Konsistenz für MLE-Typ-Bootstrapping. Wenn jedoch die globale Linearität auf diese Weise wirksam ist, ist es schwer vorstellbar, wie man Konsistenz ohne lokale Linearität beweisen würde. Das wollte Mammen wohl sagen.
Abgesehen von der obigen Diskussion von [Shao & Tu] denke ich, dass Sie eine Charakterisierungsbedingung für die Konsistenz von Bootstrap-Schätzern wollen.
Leider kenne ich keine Charakterisierung der Konsistenz eines Bootstrap-Schätzers für eine sehr allgemeine Verteilungsklasse in .M( X) Selbst wenn es eine gibt, ist meiner Meinung nach nicht nur die Glätte vonerforderlich. Es gibt jedoch eine Charakterisierung für eine bestimmte Klasse statistischer Modelle wie dieKlasse in [Gine & Zinn]; oder allgemein kompakt unterstützte Klasse (direkt aus der obigen Diskussion), die über einem polnischen Raum definiert ist.CLTT CL T
Außerdem ist die Kolmogorov-Smirnov-Distanz nach meinem Geschmack die falsche Distanz, wenn unser Fokus auf der klassischen Asymptotik liegt (im Gegensatz zur "einheitlichen" Asymptotik für empirische Prozesse). Da der KS-Abstand nicht die schwache Topologie induziert, die ein natürlicher Grund für die Untersuchung des asymptotischen Verhaltens ist, wird die schwache Topologie auf dem Raum durch den von [Huber] angenommenen begrenzten Lipschitz-Abstand (OR-Prohorov-Levy-Abstand) induziert. und viele andere Autoren, wenn der Fokus nicht auf empirischen Prozessen liegt. Manchmal beinhaltet die Diskussion des einschränkenden Verhaltens empirischer Prozesse auch eine BL-Distanz wie [Gine & Zinn].M( X)
Ich hasse es, zynisch zu sein, aber ich habe immer noch das Gefühl, dass dies nicht die einzige statistische Schrift ist, die "aus dem Nichts zitiert". Wenn ich das sage, finde ich das Zitieren von van Zwets Vortrag einfach sehr verantwortungslos, obwohl van Zwet ein großartiger Gelehrter ist.
[Wasserman] Wasserman, Larry. All of Nonparametric Statistics, Springer, 2010.
[Shao & Tu] Shao, Jun und Dongsheng Tu. Das Klappmesser und der Stiefelriemen. Springer, 1995.
[Gine & Zinn] Giné, Evarist und Joel Zinn. "Bootstrapping allgemeine empirische Maßnahmen." Die Annalen der Wahrscheinlichkeit (1990): 851-869.
[Huber] Huber, Peter J. Robuste Statistik. Wiley, 1985.
quelle