Ich möchte nur einige Argumente überprüfen.
Wenn mein Originalmuster die Größe und ich es boote, ist mein Denkprozess wie folgt:
ist die Wahrscheinlichkeit einer Beobachtung aus der Originalprobe. Um sicherzustellen, dass die nächste Ziehung nicht die zuvor untersuchte Beobachtung ist, beschränken wir die Stichprobengröße auf . So erhalten wir dieses Muster:
Ist das richtig? Ich stolpere darüber, warum es nicht .
sampling
bootstrap
sample-size
subsampling
Jayant.M
quelle
quelle
Antworten:
Beachten Sie, dass wir an jeder Beobachtungsposition ( ) eine der Beobachtungen auswählen können , so dass es mögliche Resamples gibt (wobei die Reihenfolge beibehalten wird, in der sie gezeichnet werden), von denensind die "gleiche Stichprobe" (dh sie enthalten alle ursprünglichen Beobachtungen ohne Wiederholungen; dies erklärt alle Arten der Bestellung der Stichprobe, mit der wir begonnen haben).n n n n ! ni = 1 , 2 , . . . , n n nn n ! n
Mit drei Beobachtungen, a, b und c, haben Sie beispielsweise 27 mögliche Stichproben:
Sechs davon enthalten jeweils eines von a, b und c.
Also ist die Wahrscheinlichkeit, dass die ursprüngliche Stichprobe zurückerhalten wird.n ! / nn
Nebenbei - eine schnelle Annäherung an die Wahrscheinlichkeit:
Bedenken Sie Folgendes :
so
Die untere Grenze ist die übliche für die Stirling-Näherung (die für großes einen geringen relativen Fehler aufweist ).n
[Gosper hat vorgeschlagen , was die Näherung √ ergeben würden ! ≈ ( 2 n + 13)π- -- -- -- -- -- -- -- -- -√nne- n für diese Wahrscheinlichkeit, die bis zu n = 3 oder sogar bis zu n = 1 ziemlich gut funktioniert,je nachdem, wie streng Ihre Kriterien sind.]( 2 n + 13) π- -- -- -- -- -- -- -- -√e- n n = 3 n = 1
(Antwort auf Kommentar :) Die Wahrscheinlichkeit, in einem bestimmten Resample keine bestimmte Beobachtung zu erhalten, beträgt was für großesnungefähre-1 ist.( 1 - 1n)n n e- 1
Einzelheiten finden Sie unter
Warum enthält jedes Bootstrap-Beispiel im Durchschnitt ungefähr zwei Drittel der Beobachtungen?
quelle