Was ist die beste Methode, um ein Konfidenzintervall eines Binomialversuchs zu berechnen, wenn Sie (oder ähnlich p = 1 ) schätzen und die Stichprobengröße relativ klein ist, zum Beispiel n = 25 ?
confidence-interval
binomial
Kasper
quelle
quelle
scipy.stats.beta.ppf(1−$\alpha$;x+1,n−x)
scipy.stats.beta.ppf(1−$\alpha$;x+1,n−x)
Antworten:
Verwenden Sie nicht die normale Annäherung
Über dieses Problem ist schon viel geschrieben worden. Ein allgemeiner Rat ist, niemals die normale Annäherung (dh das asymptotische / Wald-Konfidenzintervall) zu verwenden, da es schreckliche Abdeckungseigenschaften hat. R-Code zur Veranschaulichung:
Für kleine Erfolgswahrscheinlichkeiten fordern Sie möglicherweise ein Konfidenzintervall von 95% an, aber tatsächlich erhalten Sie beispielsweise ein Konfidenzintervall von 10%!
Empfehlungen
Also, was sollen wir verwenden? Ich glaube, dass die aktuellen Empfehlungen diejenigen sind, die in der Veröffentlichung Interval Estimation for a Binomial Proportion von Brown, Cai und DasGupta in Statistical Science 2001, vol. 16, nein. 2, Seiten 101–133. Die Autoren untersuchten verschiedene Methoden zur Berechnung von Konfidenzintervallen und kamen zu folgendem Ergebnis.
Das Wilson-Intervall wird manchmal auch als Bewertungsintervall bezeichnet , da es auf der Invertierung eines Bewertungstests basiert.
Berechnung der Intervalle
Um diese Konfidenzintervalle zu berechnen, können Sie diesen Online-Rechner oder die
binom.confint()
Funktion imbinom
Paket in R verwenden. Für 0 Erfolge in 25 Versuchen wäre der R-Code beispielsweise:Hier
bayes
ist das Jeffreys-Intervall. (Das Argumenttype="central"
wird benötigt, um das gleichseitige Intervall zu erhalten.)Beachten Sie, dass Sie sich vor der Berechnung des Intervalls für eine der drei Methoden entscheiden sollten . Wenn Sie sich alle drei ansehen und die kürzeste auswählen, erhalten Sie natürlich eine zu geringe Abdeckungswahrscheinlichkeit.
Eine schnelle, ungefähre Antwort
Als abschließende Bemerkung, wenn Sie genau Null Erfolge in Ihrer beobachten n Studien und wollen einfach nur eine sehr schnelle ungefähre Konfidenzintervall, können Sie die Verwendung der Regel von drei . Teilen Sie einfach die Zahl 3 durch n . Im obigen Beispiel ist n 25, die obere Grenze ist also 3/25 = 0,12 (die untere Grenze ist natürlich 0).
quelle
bayes
verwendet den Uniform-Prior (anstelle von Jeffreys), wenn beide Formparameter 1 sind. Ich habe dem Betreuer des Binom-Pakets aus Neugier über die (Un-) Vorteile von Jeffreys vs. Uniform-Prior eine E-Mail geschickt und er hat mir mitgeteilt, dass eine neue Version verwendet werden wird die Uniform vor als Standard. Wundern Sie sich also nicht, ob die Ergebnisse in Zukunft leicht variieren.binconf
MethodeHmisc
berechnet auch diese Intervalle. Standardmäßig wird die Wilson-Methode verwendet.quelle