Clopper-Pearson für Nicht-Mathematiker

12

Ich habe mich gefragt, ob mir jemand die Intuition jenseits des Clopper-Pearson CI für Proportionen erklären kann.

Soweit ich weiß, enthält jedes CI eine Varianz. Für Anteile kann jedoch der Clopper-Pearson-CI berechnet werden, auch wenn mein Anteil 0 oder 1 (0% oder 100%) beträgt. Ich habe versucht, die Formeln zu betrachten, und ich verstehe, dass sie etwas mit Perzentilen der Binomialverteilung zu tun haben, und ich verstehe, dass das Finden des CI Iterationen umfasst, aber ich habe mich gefragt, ob jemand die Logik und das Rationale in "einfachen Worten" oder mit einem Minimum an Mathematik erklären kann ?

user40850
quelle

Antworten:

22

Wenn Sie sagen, dass Sie an Konfidenzintervalle gewöhnt sind, die einen Ausdruck für Varianz enthalten, denken Sie an den Gaußschen Fall, in dem Informationen über die beiden die Grundgesamtheit charakterisierenden Parameter - einer der Mittelwerte und der andere die Varianz - in der Stichprobe zusammengefasst werden mittlere und Stichprobenvarianz. Der Stichprobenmittelwert schätzt den Populationsmittelwert, aber die Genauigkeit, mit der er dies tut, hängt von der Populationsvarianz ab, die wiederum durch die Stichprobenvarianz geschätzt wird. Die Binomialverteilung hingegen hat nur einen Parameter - die Erfolgswahrscheinlichkeit für jeden einzelnen Versuch - und alle Informationen, die die Stichprobe zu diesem Parameter liefert, sind in der Gesamtzahl 1 zusammengefasst. Erfolge aus so vielen unabhängigen Studien. Die Populationsvarianz und der Mittelwert werden beide durch diesen Parameter bestimmt.

Sie können ein Clopper-Pearson-95% -Konfidenzintervall für den Parameter , das direkt mit der Binomialwahrscheinlichkeitsmassenfunktion arbeitet. Angenommen, Sie beobachten x Erfolge aus n Versuchen. Die PMF istπxn

Pr(X=x)=(nx)πx(1π)nx

Erhöhen Sie bis die Wahrscheinlichkeit für x oder weniger Erfolge auf 2,5% sinkt: das ist Ihre Obergrenze. Verringern Sie π, bis die Wahrscheinlichkeit von x oder mehr Erfolgen auf 2,5% sinkt: das ist Ihre Untergrenze. (Ich schlage vor, Sie versuchen dies tatsächlich, wenn es nicht klar ist, was Sie darüber lesen.) Sie finden hier die Werte von π , die, wenn sie als Nullhypothese angenommen werden, dazu führen würden, dass sie (nur gerade) von einer Zwei abgelehnt werden -Test mit einem Signifikanzniveau von 5%. Langfristig decken die auf diese Weise berechneten Grenzen den wahren Wert von π zu mindestens 95% der Zeit ab.πxπxππ

Scortchi - Wiedereinsetzung von Monica
quelle
+1. Dies mag eine eigene Frage verdienen, aber ich werde hier schnell fragen: Für eine bestimmte Anwendung möchte ich ein einziges Unsicherheitsmaß (etwas, das sich wie ein Standardfehler des Mittelwerts verhält) für verschiedene Proportionen erhalten. Ich weiß, dass es eine Reihe von binomischen CI-Verfahren gibt, darunter Clopper-Pearson. Wäre es sinnvoll, ein solches CI als Unsicherheitsmaß zu verwenden? Oder vielleicht width / 1.96 / 2, damit es im Gaußschen Grenzwert genau SEM ergibt.
Amöbe sagt Reinstate Monica
1
@amoeba: Vermutlich denken Sie über kleine Stichprobengrößen nach: (1) Sie möchten wahrscheinlich eher Blaker-Spjotvoll-CIs als CIs, die auf einem Test mit gleicher Schwanzfläche basieren. (2) Die Vertrauensverteilung ist ziemlich uneinheitlich, was die Breite eines gegebenen Intervalls für die von Ihnen festgelegte Abdeckung unangenehm empfindlich machen würde.
Scortchi