Betrachten Sie eine Stichprobe von reellen Zahlen. Nehmen wir an, wir möchten die zentrale Tendenz der Bevölkerung abschätzen und ein Gefühl für unsere Unsicherheit in Bezug auf diese Schätzung bekommen.
Lassen Sie uns die Annahmen über die Bevölkerungsverteilung für einen Moment beiseite legen und die folgenden beiden Ansätze betrachten.
- Holen Sie sich ein Bootstrap-Beispiel des Eingabebeispiels. Das heißt, Probe mit Ersatz (z. B. 100 Resamples erhalten) und den Mittelwert für jede Resample berechnen. Wir geben dann den Mittelwert und das Konfidenzintervall für die resultierende empirische Verteilung der Mittelwerte aus.
- Wir geben den Mittelwert aus der Eingabestichprobe und Perzentile um den Mittelwert aus, um die Unsicherheit um die Schätzung zu vermitteln.
Bootstrap vs Originalbeispiel:
- Während ich verstehe, was Ansatz # 1 tut. Gibt es einen zugrunde liegenden Schätzer hinter # 2?
- Was würden die Perzentile um den Mittelwert in # 2 im Gegensatz zum CI von # 1 vermitteln? Ansatz Nr. 2 vermittelt ein Gefühl der Unsicherheit, aber es fällt mir schwer, ihn mit einer frequentistischen oder bayesianischen Interpretation in Verbindung zu bringen.
- Würde Methode 2 jemals einen besseren Schätzer für den Bevölkerungsdurchschnitt liefern ? (zB weniger voreingenommen und geringere Varianz)?
quelle