Betrachten Sie ein Experiment, das ein Verhältnis zwischen 0 und 1 ausgibt . Wie dieses Verhältnis erhalten wird, sollte in diesem Zusammenhang nicht relevant sein. Es wurde in einer früheren Version dieser Frage ausgearbeitet , aber aus Gründen der Klarheit nach einer Diskussion über Meta entfernt .
Dieses Experiment wird mal wiederholt , während klein ist (ungefähr 3-10). Es wird angenommen, dass die unabhängig und identisch verteilt sind. Aus diesen schätzen wir den Mittelwert durch Berechnung des Durchschnitts , aber wie berechnet man ein entsprechendes Konfidenzintervall ?
Bei Verwendung des Standardansatzes zur Berechnung von Konfidenzintervallen ist manchmal größer als 1. Meiner Intuition nach ist das richtige Konfidenzintervall ...
- ... sollte zwischen 0 und 1 liegen
- ... sollte mit zunehmendem n kleiner werden
- ... liegt ungefähr in der Größenordnung derjenigen, die mit dem Standardansatz berechnet wurde
- ... wird nach einer mathematisch fundierten Methode berechnet
Dies sind keine absoluten Voraussetzungen, aber ich möchte zumindest verstehen, warum meine Intuition falsch ist.
Berechnungen basieren auf vorhandenen Antworten
Im Folgenden werden die aus den vorhandenen Antworten resultierenden Konfidenzintervalle für verglichen .
Standardansatz (auch bekannt als "Schulmathematik")
,σ2=0,0204, daherbeträgtdas 99% -Konfidenzintervall[0,865,1,053]. Dies widerspricht der Intuition 1.
Zuschneiden (vorgeschlagen von @soakley in den Kommentaren)
Es ist einfach, den Standardansatz zu verwenden und dann als Ergebnis bereitzustellen . Aber dürfen wir das tun? Ich bin noch nicht davon überzeugt, dass die untere Grenze einfach konstant bleibt (-> 4.)
Logistisches Regressionsmodell (vorgeschlagen von @Rose Hartman)
Transformierte Daten: Ergebnis ist [ 0,173 , 7,87 ] , das Rücktransformieren ergibt [ 0,543 , 0,999 ] . Offensichtlich ist der 6.90 ein Ausreißer für die transformierten Daten, während der 0.99 nicht für die nicht transformierten Daten gilt, was zu einem sehr großen Konfidenzintervall führt . (-> 3.)
Binomial Proportion Confidence Intervall (vorgeschlagen von @Tim)
Der Ansatz sieht ganz gut aus, passt aber leider nicht zum Experiment. Das einfache Kombinieren der Ergebnisse und Interpretieren als ein großes wiederholtes Bernoulli-Experiment, wie von @ZahavaKor vorgeschlagen, ergibt Folgendes:
von insgesamt 5 ∗ 1000 . Einspeisung in den Adj. Wald-Rechner gibt [ 0,9511 , 0,9657 ] . Dies scheint nicht realistisch zu sein, da sich kein einziges X i innerhalb dieses Intervalls befindet! (-> 3.)
Bootstrapping (vorgeschlagen von @soakley)
Mit wir 3125 mögliche Permutationen. Nehmen Sie die 3093Mittelwert der Permutationen, wir erhalten[0,91,0,99]. Sieht nichtsoschlecht aus, obwohl ich ein größeres Intervall erwarten würde (-> 3.). Es ist jedoch pro Konstruktion niemals größer als[min(Xi),max(Xi)]. Für eine kleine Stichprobe wird sie daher eher wachsen als schrumpfen, umn(-> 2)zu erhöhen. Dies ist zumindest der Fall bei den oben angegebenen Beispielen.
quelle
Antworten:
Erstens, um zu verdeutlichen, handelt es sich nicht um eine Binomialverteilung, wie Ihre Frage nahelegt (Sie bezeichnen sie als Bernoulli-Experiment). Binomialverteilungen sind diskret - das Ergebnis ist entweder Erfolg oder Misserfolg. Ihr Ergebnis ist eine Kennzahl, die bei jeder Durchführung Ihres Experiments verwendet wird , nicht eine Reihe von Erfolgen und Fehlern, für die Sie dann eine Zusammenfassungskennzahl berechnen. Aus diesem Grund werden bei Methoden zur Berechnung eines Konfidenzintervalls für den Binomialanteil viele Ihrer Informationen verworfen. Und dennoch haben Sie Recht, dass es problematisch ist, dies als normal verteilt zu behandeln, da Sie ein CI erhalten können, das über den möglichen Bereich Ihrer Variablen hinausgeht.
Ich empfehle, dies als logistische Regression zu betrachten. Führen Sie ein logistisches Regressionsmodell mit Ihrer Verhältnisvariablen als Ergebnis und ohne Prädiktoren aus. Der Intercept und sein CI geben Ihnen das, was Sie in Logs benötigen, und Sie können es dann wieder in Proportionen umwandeln. Sie können die logistische Konvertierung auch einfach selbst durchführen, den CI berechnen und dann wieder in die ursprüngliche Skala konvertieren. Meine Python ist schrecklich, aber so könnte man das in R machen:
Hier sind die Unter- und Obergrenzen eines 99% CI für diese Daten:
quelle
Möglicherweise möchten Sie Resampling / Bootstrapping versuchen. Schauen wir uns den einfachen Fall an, den Sie erwähnt haben.
Mit 3 Datenpunkten von 0,99, 0,94 und 0,94 würden Sie nicht einmal das Resampling durchführen, da Sie einfach alle 27 möglichen Permutationen auflisten, den jeweiligen Mittelwert finden und dann die Mittelwerte sortieren können.
Die Frage hier: Wie erstellen wir ein Konfidenzintervall für den Parameter eines Permutationstests? Gibt weitere Details, einschließlich einiger R-Codes.
quelle
Binomiale Konfidenzintervalle sind seit langem Gegenstand statistischer Debatten. Ihr Problem wird mit einem Verhältnis von weniger als 100% betrachtet, aber es wird noch problematischer, wenn wir 100% verwenden. Eine aufschlussreiche Möglichkeit, die Frage zu stellen, ist:
Bei einer so hohen Erfolgsquote halten wir die Chancen für ziemlich hoch, können uns aber nicht zu 100% sicher sein (das Universum könnte zuerst explodieren oder so). Selbst wenn Sie einen Anteil von 100% hätten, können wir das Konfidenzintervall bei nicht kollabieren lassenp=1 .
Es gibt eine Reihe von Methoden, um diese Schwänze zu berechnen. Ich würde empfehlen, Wikipedia nach dem Rechnen zu durchsuchen, oder, wenn Sie nur die Antwort wünschen, nach einem Binomialintervallrechner wie diesem zu suchen (der zufällig auch mehr Erklärungen zur Mathematik enthält).
quelle
Ein bayesianischer Ansatz:
Finden Sie die einzigartige Beta-DistributionB das wird durch die Experimente (und einen früheren, sagen wir den früheren Jeffreys) induziert, und wählen Sie dann das kleinste Intervall für das B Die Dichte von wird in Ihr gewünschtes "Vertrauen" integriert. Es ist möglich, dass es mehrere Lösungen gibt. Abhängig von Ihrer vorherigen Version liegt das mittlere Verhältnis möglicherweise nicht in Ihrem Intervall.
quelle