Was ist, wenn die Wahrscheinlichkeiten in der „.632-Regel“ nicht gleich sind?

11

Diese Frage leitet sich aus dieser Frage nach der ".632-Regel" ab. Ich schreibe unter besonderer Bezugnahme auf die Antwort / Notation von user603, soweit dies die Sache vereinfacht.

Die Antwort beginnt mit einer Probe der Größe n, mit dem Ersatz von n verschiedenen Elementen in der Sammlung (Call) es N. Die Wahrscheinlichkeit , dass die ith Probe si von einem bestimmten Elemente unterscheidet m von N ist dann (11/n).

In dieser Antwort haben alle Elemente von N die gleiche Chance, zufällig gezogen zu werden.

Meine Frage lautet: Nehmen wir stattdessen an, dass in der obigen Frage die zu zeichnenden Elemente so sind, dass sie normal verteilt sind. Das heißt, wir unterteilen die Standardnormalkurve von Z=4 bis Z=4 in (sagen wir) 100 gleich lange Teilintervalle. Jedes der 100 Elemente in N hat eine Wahrscheinlichkeit, gezeichnet zu werden, die der Fläche entspricht, die von der Kurve in ihrem jeweiligen Intervall begrenzt wird.

Mein Denken war wie folgt:

Die Argumentation ähnelt der in der verknüpften Antwort, denke ich. Die Wahrscheinlichkeit, dass sim mit m ein Element von N ist, ist P(sim)=(1Fi) wobei Fi die Wahrscheinlichkeit ist, s i zu zeichnen .si.

Die Wahrscheinlichkeit, dass sich ein bestimmtes Element m in der Stichprobe S der Größe n befindet, beträgt

= 1 - n 1 ( 1 - F i ) .

P(mS)=1P(mS)=11nP(sim)
=11n(1Fi).

Eine Berechnung scheint zu zeigen, dass die Antwort mit zunehmender Länge der Teilintervalle gegen dieselbe Zahl wie im ersten Fall konvergiert (Wahrscheinlichkeiten von alle gleich).si

Dies scheint (für mich) nicht intuitiv zu sein, da die Konstruktion Elemente von N zu werfen scheint, die selten sind, so dass ich eine Zahl kleiner als 0,632 erwarten würde.

Auch wenn dies richtig ist, hätten wir es wohl getan

limn1n(1Fi)=lim(11/n)n=1/e,

was ich noch nicht als wahr oder falsch kenne.

Bearbeiten: Wenn es wahr ist, würde es wahrscheinlich einige verallgemeinern.

Vielen Dank für alle Einblicke.

Daniel
quelle
Ich habe gerade nach der letzten Gleichung zu Mathematics SE (Frage 791114) gefragt, weil mich auch interessiert, wie sie sich verallgemeinert, wenn überhaupt.
Daniel
... und die kurze Antwort lautet, dass die letzte Gleichheit für gut erzogene PDFs korrekt ist. Die Antwort auf die Frage lautet also, dass die .632-Regel für eine Vielzahl von zugrunde liegenden Distributionen gilt.
Daniel
Kann ich die Antwort eines anderen von einer anderen Site abrufen und hier als meine posten? Deshalb habe ich den kurzen Kommentar gepostet. Vielleicht gibt es einen akzeptierten Weg, dies zu tun, wenn ja, bin ich zugänglich.
Daniel
Natürlich können Sie, erwähnen Sie einfach die Quelle irgendwann :)
Firebug
@Firebug: Können Sie auf eine Instanz verweisen, in der dies getan wird, damit ich sehen kann, was Sie meinen? Vielen Dank.
Daniel

Antworten:

2

Die Frage fragt nach dem einschränkenden Verhalten von

(1)=1i=1n(1Fi)

wenn wächst und das F i gleichmäßig schrumpft, so dass (a) alle nicht negativ sind und (b) sie sich zu einer Einheit summieren. (Diese ergeben sich aus dem Bau des F inFi Fi und die Axiome der Wahrscheinlichkeit.)

Per Definition ist dieses Produkt das Exponential seines Logarithmus:

i=1n(1Fi)=exp(i=1nlog(1Fi)).

log , legt dies fest

log(1Fi)=Fi12ϕi2Fi12Fi2

ϕi[0,Fi]Fi 1/2Fi2nFiϵ>0Finϵ>Fi=1

i=1nFi2i=1nϵ2<i=1n(1n)2=1n.

Folglich

1=i=1nFii=1nlog(1Fi)i=1nFi121n=112n

1expi=1n(1Fi)exp(1)

limn(1i=1n(1Fi))=1exp(1)0.632,

QED.


A closer look at this analysis establishes that the error in this approximation (which will always be a lower bound) is no greater in size than

(exp((n/2)max(Fi2))1)exp(1).
For instance, the division of a standard Normal distribution into n=400 slices between 4 and 4 produces a maximum Fi near the mode 0, where it will approximately equal the area of a rectangle there, exp(1/2)/500.012. The foregoing bound establishes the value of formula (1) will be within 0.011 of its limiting value. The actual error is an order of magnitude less, 0.001041. Here's the calculation in R (which we can trust because none of the fi is truly small relative to 1):
f <- diff(pnorm(seq(-4, 4, length.out=401))) # The normal "slices".
f <- f / sum(f)                              # Make them sum to unity.
exp(-1) - prod(1 - f)                        # Compute the error.

Indeed, 1 - prod(1-f) is 0.6331615 whereas 1exp(1) is 0.6321206.

whuber
quelle
2
The error analysis is a very helpful aspect of this answer.
daniel