Vergleich von 0/10 mit 0/20

10

Gibt es eine Möglichkeit, bei der Erörterung der Aufgabenerfüllungsraten zu zeigen, dass 0 von 20 Versuchen "schlechter" sind als 0 von 10 Versuchen?

vinne
quelle
1
Sie können versuchen, en.wikipedia.org/wiki/Additive_smoothing zu verwenden, aber es werden eher Hände winken als solide Beweise
abukaj
Woher weißt du, dass es schlimmer ist? Wenn beispielsweise nur 10 Versuche möglich wären, wissen Sie nicht , wie hoch die Punktzahl bei weiteren Versuchen wäre.
Tim
4
Vielleicht ein Konfidenzintervall für den geschätzten Anteil?
Mdewey
5
Dies scheint mir eine vernünftige Frage zu sein. Es basiert auf einer völlig normalen Intuition, die diskutiert werden kann, und es gibt statistische Möglichkeiten (z. B. Bayesian), um das Problem anzugehen. Ich stimme dafür, offen zu lassen.
Gung - Reinstate Monica
1
Ich stimme @gung zu. Das ist eine gute Frage.
Alexis

Antworten:

3

Angenommen, wir kennen die Erfolgswahrscheinlichkeit eines Versuchs. In diesem Fall berechnen wir die Wahrscheinlichkeit von 0 von 10 und 0 von 20 Fällen.

In diesem Fall gehen wir jedoch umgekehrt. Wir kennen die Wahrscheinlichkeit nicht, wir haben die Daten und wir versuchen, die Wahrscheinlichkeit zu schätzen.

Je mehr Fälle wir haben, desto sicherer können wir hinsichtlich der Ergebnisse sein. Wenn ich eine Münze umwerfe und es Kopf ist, werden Sie nicht sehr sicher sein, dass es Doppelkopf ist. Wenn ich es 1000 Mal werfe und es alle Köpfe sind, ist es unwahrscheinlich, dass es ausgeglichen ist.

Es gibt Methoden, die entwickelt wurden, um die Anzahl der Trails bei der Abgabe der Schätzungen zu berücksichtigen. Eine davon ist die additive Glättung , über die @abukaj oben einen Kommentar abgegeben hat. Bei der additiven Glättung werden zusätzliche Pseudo-Samples berücksichtigt. In unserem Fall fügen wir dem Pfad, den wir gesehen haben, zwei weitere hinzu - einen erfolgreichen und einen fehlgeschlagenen.

  • Im ersten Fall beträgt die geglättete Wahrscheinlichkeit = ~ 8,3% 11+010+1+1112
  • Im zweiten Fall erhalten wir = ~ 4,5% 11+020+1+1122

Beachten Sie, dass die additive Glättung nur eine Schätzmethode ist. Sie erhalten unterschiedliche Ergebnisse mit unterschiedlichen Methoden. Selbst mit der additiven Glättung selbst hätten Sie unterschiedliche Ergebnisse erzielt, wenn Sie 4 Pseudo-Samples hinzugefügt hätten.

Eine andere Methode ist die Verwendung des Konfidenzintervalls, wie von @mdewey vorgeschlagen. Je mehr Stichproben wir haben, desto kürzer wird das Konfidenzintervall. Die Größe des Konfidenzintervalls ist proportional zur Quadratwurzel der Stichproben - . Daher führt eine Verdoppelung der Anzahl der Abtastwerte zu einem kürzeren Konfidenzintervall.1n2

Der Mittelwert in beiden Fällen ist 0. Wir nehmen ein Konfidenzniveau von 90% an (z = 1,645)

  • Im ersten Fall erhalten wir 0 + ~ 52%1.64510
  • Im zweiten Fall erhalten wir 0 + ~ 36%1.64520

Bei fehlenden Daten besteht Unsicherheit. Die Annahmen, die Sie treffen, und die externen Daten, die Sie verwenden, ändern, was Sie erhalten.

DaL
quelle
1
Vielen Dank Dan Levin. Ihre Antwort war klar genug für einen Nicht-Mathematiker und dennoch robust genug für mich, um Ihre Erklärung intuitiv zu akzeptieren. Vielen Dank an alle Kommentatoren für Ihre Eingabe.
Vinne
1

Um die Idee des Aufrufs von Konfidenzintervallen zu erweitern, gibt es ein Konzept eines exakten Binomialintervalls.

Die Binomialverteilung ist die Gesamtzahl der Erfolge in unabhängigen Versuchen, die entweder mit 0 (Misserfolg) oder 1 (Erfolg) enden. Die Wahrscheinlichkeit, 1 (Erfolg) zu erhalten, wird traditionell mit , und sein Komplement ist . Dann ist das Standardwahrscheinlichkeitsergebnis, dass die Wahrscheinlichkeit von genau Erfolgen in Versuchen istq = 1 - p k npq=1pkn

pn,k=(nk)pkqnk=n!k!(nk)!pkqnk

Das Konzept des Konfidenzintervalls besteht darin, eine Reihe möglicher Werte der Modellparameter (hier Erfolgswahrscheinlichkeiten ) zu binden, damit wir probabilistische (gut, häufig auftretende ) Aussagen darüber treffen können, ob der wahre Parameterwert innerhalb dieses Intervalls liegt (nämlich Wenn wir das probabilistische Experiment von 10 oder 20 Versuchen wiederholen und das Konfidenzintervall auf eine bestimmte Weise konstruieren, werden wir feststellen, dass der wahre Wert des Parameters in 95% der Fälle innerhalb des Intervalls liegt.p

In diesem Fall können wir in dieser Formel nach auflösen: p

pn,0=(1p)n

Wenn wir also ein einseitiges Intervall von 95% wollten, würden wir , um die Wahrscheinlichkeit zu ermitteln, dass die beobachtete Nullzahl höchstens 5% beträgt. Für lautet die Antwort (dh im Extremfall, wenn die Wahrscheinlichkeit eines Erfolgs in jedem Versuch 13,9% beträgt, beträgt die Wahrscheinlichkeit, keine Erfolge zu beobachten, 5%). Für lautet die Antwort . Aus einer Stichprobe von haben wir also mehr gelernt als aus der Stichprobe von , in dem Sinne, dass wir den Bereich "ausschließen" können, in dem die Stichprobe von geht immer noch als plausibel.pn,0=5%n=20[0%,13.9%]n=10[0%,25.9%]n=20n=10[13.9%,25.9%]n=10

StasK
quelle
0

Ein Bayes'scher Ansatz

Die Wahrscheinlichkeitsfunktion ist Bernoulli und die Beta-Verteilung ist ein Konjugat vor der Bernoulli-Verteilung, daher folgt der hintere Teil der Beta-Verteilung. Darüber hinaus wird der Posterior parametrisiert durch:

α^=α+i=1nXiβ^=β+ni=1nXi

Folglich:

E[pX1,,Xn]=α^α^+β^=α+i=1nXiα+β+n

Wenn Sie also 10 Ausfälle zu sehen, Ihre Erwartung von ist , und wenn Sie 20 Ausfälle zu sehen, Ihre Erwartung von ist . Je mehr Fehler Sie sehen, desto geringer ist Ihre Erwartung von .pαα+β+10pαα+β+20p

Ist das ein vernünftiges Argument? Es hängt davon ab, wie Sie sich zur Bayes'schen Statistik fühlen und ob Sie bereit sind, die Unsicherheit über einen Parameter mithilfe der Wahrscheinlichkeitsmechanik zu modellieren . Und es hängt davon ab, wie vernünftig Ihre Wahl eines Prior ist.p

Matthew Gunn
quelle