Ist dies eine gültige Methode zum Erstellen eines Konfidenzintervalls?

7

Die Dreierregel besagt, dass, wenn wir beobachten, dass 0 ist, ein 95% -Konfidenzintervall für . Ich bin verwirrt über die Ableitung dieser Regel auf Wikipedia und anderswo.YBin(n,p)[0,3/n]p

Wikipedia entspricht dem Finden eines 95% -Konfidenzintervalls dem Finden aller so dass . Ich kämpfe darum, dies mit meinem eigenen Verständnis in Einklang zu bringen, dass ein 95% -Konfidenzintervall ein zufälliger Bereich so dass für alle .pPp(Y=0)0.05C(Y)Pp(C(Y) covers p)=0.95p

Bearbeiten: Ich habe festgestellt, dass meine Frage vage war (und ich habe eine falsche Vermutung über die zugrunde liegende Logik von Wikipedia gelöscht). Meine Hauptfrage lautet: Wie ist das Wikipedia-Argument gerechtfertigt? Meine andere verwandte Frage lautet: Wie überprüfen Sie die Abdeckungswahrscheinlichkeit für das Intervall, da es nur für einen möglichen Wert von ?Y


quelle

Antworten:

5

Hanley und Lippman-Hand (1983) geben so etwas wie das folgende Argument an, das die Regel motiviert. Nimm als fest, .nP(X=0|p)=(1p)n

Wenn wir nach lösen wir . Das kleinste , das die Wahrscheinlichkeit von nicht kleiner als ist .(1p)nαpp1α1np0α1α1n

Jetzt ist .α1n=e1nlogα=1+1nlogα+12(1nlogα)2+...

Bei der ersten Bestellung erhalten wir . Wenn , .p1nlogαα=0.05log(0.05)/n3/n

Jovanovic & Levy (1997) verbessern dies, indem sie es klarer auf ein CI-Argument stützen, indem sie es als Clopper-Pearson-Intervall umwandeln und dieselbe Bindung und damit dieselbe ungefähre Obergrenze erhalten gebunden auf :(1p)n=αp

Wenn die beobachtete Anzahl von Ereignissen in n Versuchen ist, kann die Clopper-Pearson (max-P) obere 100% -Bindung als Lösung für erhalten werdenX=x(1α)

t=0x(nt)pt(1p)t=α

Wenn , reduziert sich der Ausdruck eindeutig aufx=0(1p)n=α

Sie diskutieren auch einige andere Argumente.

Hanley, JA, und Lippman-Hand, A. (1983),
"Wenn nichts schief geht, ist alles in Ordnung? Interpretation von Nullzählern"
Journal of the American Medical Association, 249 (13), 1743-1745.

Jovanovic, BD und Levy, PS (1997),
"Ein Blick auf die Dreierregel"
The American Statistician, 51 (2), 137-139

Glen_b -State Monica
quelle
Die Annäherung macht Sinn, aber bin ich zu Recht skeptisch gegenüber der Logik? Wenn Sie beispielsweise beobachten, dass 0 ist, können Sie sagen, dass ein CI für da es durch impliziert wird ? YPois(λ)[0,logα]1αλPλ(Y=0)=exp(λ)α
Wie Sie meiner zweiten Referenz entnehmen können, muss das Argument von Hanley & Lippman-Hand ein solides Argument sein - es ist kein Argument für ein Intervall -, aber Jovanovic & Levy geben ein auf dem Konfidenzintervall basierendes Argument an (ich habe jetzt weitere Details hinzugefügt). . Ich glaube, Sie könnten wahrscheinlich einem ähnlichen intervallbasierten Argument folgen, das Jovanovic und Levy geben, um die Grenze zu erhalten, die Sie für den Poisson erhalten haben. Ich habe es jedoch nicht versucht.
Glen_b -State Monica
3

Bei Erfolgen von Versuchen ist das genaue (Clopper-Pearson) Konfidenzintervall so dass undk=0n[p1,p2]

P(Kk=0|p=p1)=α2
P(Kk=0|p=p2)=α2,

wo . Sie können mit der inversen Binomialfunktion berechnen . Es ist jedoch auch möglich, von Hand zu lösen, da das kumulative Binom in diesem speziellen Fall sehr einfach ist: . Auf die gleiche Weise können Sie auch eine Poisson-Näherung verwenden, um .KBinomial(n,p)[p1,p2]pi(1p)n=αenp=α

Hier ist ein Diagramm der Approximation als Funktion der Stichprobengröße:

Geben Sie hier die Bildbeschreibung ein

Dimitriy V. Masterov
quelle