Angenommen, wir haben einen Bernoulli-Prozess mit der Ausfallwahrscheinlichkeit (der klein sein wird, z. B. ), aus dem wir eine Stichprobe erstellen, bis wir auf Fehler stoßen . Wir schätzen die Ausfallwahrscheinlichkeit als wobei die Anzahl der Stichproben ist.q ≤ 0,01 10 q : = 10 / N N
Frage : Ist eine voreingenommene Schätzung von ? Und wenn ja, gibt es eine Möglichkeit, dies zu korrigieren? q
Ich bin besorgt, dass das Beharren auf der letzten Stichprobe einen Fehler darstellt, der die Schätzung verzerrt.
Antworten:
Es ist wahr , dass q eine vorgespannte Schätzung ist q in dem Sinne , dass E ( q ) ≠ q , aber man sollte nicht unbedingt läßt dies abschrecken. Dieses genaue Szenario kann als Kritik gegen die Idee verwendet werden, dass wir immer unvoreingenommene Schätzer verwenden sollten, da hier die Verzerrung eher ein Artefakt des jeweiligen Experiments ist, das wir gerade durchführen. Die Daten sehen genauso aus, als ob wir die Anzahl der Stichproben im Voraus ausgewählt hätten. Warum sollten sich unsere Schlussfolgerungen ändern?q^ q E(q^)≠q
Wenn Sie Daten auf diese Weise erfassen und dann die Wahrscheinlichkeitsfunktion sowohl für das Binomialmodell (feste Stichprobengröße) als auch für das negative Binomialmodell aufschreiben, stellen Sie interessanterweise fest, dass beide proportional zueinander sind. Dies bedeutet , dass q nur die gewöhnliche Maximum - Likelihood - Schätzung unter dem negativen Binomialmodells ist, was natürlich eine vollkommen vernünftige Schätzung ist.q^
quelle
Es besteht nicht darauf, dass die letzte Stichprobe ein Fehler ist, der die Schätzung verzerrt, sondern den Kehrwert vonN
Also in deinem Beispiel aber E[10E[N10]=1q . Dies kommt einem Vergleich des arithmetischen Mittels mit dem harmonischen Mittel naheE [ 10N] ≠q
Die schlechte Nachricht ist, dass die Vorspannung zunehmen kann , wenn kleiner wird, wenn auch nicht viel, wenn q bereits klein ist. Die gute Nachricht ist, dass die Vorspannung abnimmt, wenn die erforderliche Anzahl von Fehlern zunimmt. Es scheint, dass, wenn Sie f Fehler benötigen , die Vorspannung oben durch einen multiplikativen Faktor von f begrenzt wirdq q f für kleinesq; Sie möchten diesen Ansatz nicht, wenn Sie nach dem ersten Ausfall anhalten ff- 1 q
Stoppen nach Ausfällen, mit q = 0,01 Sie erhalten E [ N10 q= 0,01 aber E[10E [ N10] =100 , während beiq=0,001Sie erhaltenE[NE [ 10N] ≈0.011097 q= 0,001 aber E[10E [ N10] =1000 . Ein Bias von ungefähr10E [ 10N] ≈0.001111 multiplikativer Faktor 109
quelle
Als Ergänzung zu dsaxton Antwort, sind hier einige Simulationen in R die Sampling - Verteilung zeigt , q , wenn k = 10 und q 0 = 0,02 :q^ k=10 q0=0.02
Es sieht aus wie , die ein eher kleine Vorspannung in Bezug auf die Variabilität in ist q .E[q^]≈0.022 q^
quelle
10+rnbinom(10000,10,0.02)
10/(10+rnbinom(10000,10,0.02))
. Die Parametrisierung bezieht sich eher auf die Anzahl der Erfolge / Misserfolge als auf die Gesamtzahl der Versuche. Sie müssen also k = 10 zurückaddieren. Man beachte, dass der unverzerrte Schätzer9/(9+rnbinom(10000,10,0.02))
ein Zähler und ein Nenner weniger wäre .