Bootstrap-Konfidenzintervalle für Parameter oder für die Verteilung?

9

Entschuldigen Sie, was eine offensichtliche Frage zum Bootstrapping sein kann. Ich wurde früh in die Bayes'sche Welt hineingezogen und habe Bootstrapping nie so sehr erforscht, wie ich es hätte tun sollen.

Ich bin auf eine Analyse gestoßen, bei der die Autoren an einer Überlebensanalyse interessiert waren, die sich auf einige Zeit bis zu Fehlerdaten bezog. Sie hatten ungefähr 100 Punkte und verwendeten Regression, um eine Weibull-Verteilung an die Daten anzupassen. Als Ergebnis davon erhielten sie Schätzungen der Skalen- und Formparameter. Ein sehr traditioneller Ansatz. Als nächstes verwendeten sie jedoch Bootstrapping, um eine Stichprobe aus dem ursprünglichen Datensatz zu erstellen, und führten für jede neue Stichprobe eine Regression durch und entwickelten eine neue Weibull-Verteilung. Die Ergebnisse des Bootstrapings wurden dann verwendet, um Konfidenzintervalle für die Überlebensverteilung zu konstruieren.

Meine Intuition ist ein bisschen widersprüchlich. Ich bin mit dem Bootstrapping von Konfidenzintervallen für Parameter vertraut, habe jedoch nicht gesehen, dass es zum Erstellen von Verteilungskonfidenzintervallen verwendet wird.

Kann mich jemand auf eine Referenz / Quelle hinweisen, die einen Einblick geben könnte? Danke im Voraus.

Aengus
quelle
3
Die Frage ist tatsächlich allgemeiner als Sie annehmen, da es wirklich nicht darauf ankommt, wie die Parameter geschätzt wurden. Der Kern der Sache ist, dass die Parameter die Verteilungen vollständig bestimmen. Somit wird ein Satz von simultan CIs auf den Parametern ist ein CI für die Verteilungen.
whuber
Ich verstehe das und vielleicht ist es so einfach. Was mich vielleicht nervt, ist, dass das Bootstrapping mit seinem eigenen Gepäck geliefert wird, und ich habe mich gefragt, ob das Verfahren etwas enthält, das zusätzliche Probleme mit sich bringt, wenn es für diesen nächsten Schritt verwendet wird. Andererseits könnte es nur das sein, was ich zum Frühstück hatte, das nagt. Danke für den kurzen Kommentar.
Aengus
Muss
4
Es gibt mindestens zwei Möglichkeiten zum Bootstrap. Der einfachste Weg besteht darin, einfach eine Zufallsstichprobe aus den gegebenen Beobachtungen zu ziehen und das Modell b-mal zu schätzen (Bootstrapping "Paare"). Sie können auch mit den Residuen eines Modells booten ("Residuen" -Bootstrap). Die erste Methode vernachlässigt die Fehlerstruktur in den Daten, wobei die zweite Methode implizit davon ausgeht, dass Ihr Modell korrekt ist. Efron & Tibshirani (1993). "Eine Einführung in den Bootstrap" ist der Ausgangspunkt.
Jason Morgan

Antworten:

1

Wenn Sie ein gemeinsames Konfidenzintervall für die Parameter haben, die eine Verteilung eindeutig beschreiben, haben Sie grundsätzlich ein Verteilungskonfidenzintervall. Ihr Problem verschwindet also ... laut Whubers Kommentar.

Peter Ellis
quelle