Bootstrapping mit einer kleinen Anzahl von Beobachtungen

8

Angenommen, ich habe eine kleine Anzahl (N) von Beobachtungen für eine Hypothese gesammelt , die ich testen möchte. Ich könnte die Bootstrap-Methode verwenden, um eine Stichprobenverteilung für das mittlere Ergebnis von N Beobachtungen zu erstellen, aber ich befürchte, dass dieses Modell zusammenbrechen könnte, wenn N sehr klein wird, was zu Fehlern in der Stichprobenverteilung selbst führt.

Meine Frage ist also, wie ich bestimmen kann, welches Minimum N ich für vernünftige Ergebnisse benötige. oder quantitativer, wie ist N an den Abtastfehler als N-> 0 gebunden?

Update: Ich werde verstehen, dass der Mindestwert für N abhängig von der Art der zugrunde liegenden Daten variiert. Welche Meta-Beobachtungen kann ich in diesem Fall machen, um dies festzustellen? Ich kenne die wahre zugrunde liegende Distribution nicht, sonst müsste ich nicht booten.

G__
quelle
1
Ich habe einen interessanten Kommentar in den Vorlesungsunterlagen von Prof. Wasserman unter stat.cmu.edu/~larry/=stat705/Lecture13.pdf gesehen . Die Notation neben Gleichung (21) auf p. 6 legt nahe, dass der Fehler, mit dem Sie sich befassen, als 1 / sqrt (n) abfällt. Leider weiß ich nichts über den konstanten Koeffizienten.
Max

Antworten:

7

Es gibt keine eindeutige Antwort darauf, da dies immer von der tatsächlichen Verteilung Ihrer Daten abhängt (stellen Sie sich den entarteten Fall vor, in dem nur 1 zulässig ist: Dann ist ein Bootstrap aus einer Stichprobe der Größe 1 so gut wie alles andere !) und die Statistik, die Sie berechnen werden: Einige Statistiken haben mehr Probleme, sich von einer kleinen Stichprobengröße zu erholen als andere (stellen Sie sich ein Resampling eines extremen Ausreißers vor).

Also: Sie müssen genauer sein als das, was Sie uns bisher gegeben haben.

Nick Sabbe
quelle
1
Kann man anhand der Beobachtungen Rückschlüsse auf die wahre Verteilung ziehen, vielleicht unter Verwendung der Varianz der Beobachtungen? Der extreme Ausreißerfall ist schwierig, aber wenn Sie einen gesehen haben, enthält dieser eine Menge Informationen. Wenn wir die Frage überarbeiten, um N> 2 anzugeben, sagt uns bereits die zweite Beobachtung etwas, wenn N1 = N2 vs N1! = N2 (und was der Unterschied zwischen ihnen ist).
G__
Bootstrapping von Extremen funktioniert nicht, Punkt.
kjetil b halvorsen