Diese Frage leitet sich aus dieser Frage nach der ".632-Regel" ab. Ich schreibe unter besonderer Bezugnahme auf die Antwort / Notation von user603, soweit dies die Sache vereinfacht.
Die Antwort beginnt mit einer Probe der Größe mit dem Ersatz von verschiedenen Elementen in der Sammlung (Call) es N. Die Wahrscheinlichkeit , dass die Probe von einem bestimmten Elemente unterscheidet von N ist dann
In dieser Antwort haben alle Elemente von N die gleiche Chance, zufällig gezogen zu werden.
Meine Frage lautet: Nehmen wir stattdessen an, dass in der obigen Frage die zu zeichnenden Elemente so sind, dass sie normal verteilt sind. Das heißt, wir unterteilen die Standardnormalkurve von bis in (sagen wir) 100 gleich lange Teilintervalle. Jedes der 100 Elemente in N hat eine Wahrscheinlichkeit, gezeichnet zu werden, die der Fläche entspricht, die von der Kurve in ihrem jeweiligen Intervall begrenzt wird.
Mein Denken war wie folgt:
Die Argumentation ähnelt der in der verknüpften Antwort, denke ich. Die Wahrscheinlichkeit, dass mit ein Element von N ist, ist wobei die Wahrscheinlichkeit ist, s i zu zeichnen .
Die Wahrscheinlichkeit, dass sich ein bestimmtes Element m in der Stichprobe S der Größe n befindet, beträgt
= 1 - n ≤ 1 ( 1 - F i ) .
Eine Berechnung scheint zu zeigen, dass die Antwort mit zunehmender Länge der Teilintervalle gegen dieselbe Zahl wie im ersten Fall konvergiert (Wahrscheinlichkeiten von alle gleich).
Dies scheint (für mich) nicht intuitiv zu sein, da die Konstruktion Elemente von N zu werfen scheint, die selten sind, so dass ich eine Zahl kleiner als 0,632 erwarten würde.
Auch wenn dies richtig ist, hätten wir es wohl getan
was ich noch nicht als wahr oder falsch kenne.
Bearbeiten: Wenn es wahr ist, würde es wahrscheinlich einige verallgemeinern.
Vielen Dank für alle Einblicke.
quelle
Antworten:
Die Frage fragt nach dem einschränkenden Verhalten von
wenn wächst und das F i gleichmäßig schrumpft, so dass (a) alle nicht negativ sind und (b) sie sich zu einer Einheit summieren. (Diese ergeben sich aus dem Bau des F in Fi Fi und die Axiome der Wahrscheinlichkeit.)
Per Definition ist dieses Produkt das Exponential seines Logarithmus:
Folglich
QED.
A closer look at this analysis establishes that the error in this approximation (which will always be a lower bound) is no greater in size than
R
(which we can trust because none of theIndeed,0.6331615… whereas 1−exp(−1) is 0.6321206… .
1 - prod(1-f)
isquelle