Angenommen, wir haben eine Menge A und eine Teilmenge B. Wenn wir | A | kennen, können wir | B | berechnen durch Finden der Wahrscheinlichkeit p, dass ein Element, das gleichmäßig zufällig aus A ausgewählt wird, zu B gehört. Insbesondere | A | p = | B |.
Angenommen, wir erzeugen n Elemente von A gleichmäßig zufällig und verwenden diese Daten, um p (Anzahl der Elemente in B geteilt durch n) zu schätzen und damit | B | zu schätzen.
Wie zuverlässig ist diese Schätzung? Dh wie können wir den Fehler berechnen?
Gibt es als Nebenfrage einen Namen für diese Technik? (Es scheint eine mathematische Version der Mark-and-Recapture- Technik zu sein.)
estimation
Douglas S. Stones
quelle
quelle
Antworten:
Sie schätzen die Proportionen. Stellen Sie sich der Vollständigkeit halber vor, dass A die Wählerbevölkerung und B die Wählergruppe ist, die für einen bestimmten Kandidaten stimmen. Somit wäre p der Prozentsatz der Wähler, die für diesen Kandidaten stimmen würden. Lassen:
Mit anderen Worten:
Dann ist jede Ihrer Stichproben eine Bernoulli-Studie mit der Wahrscheinlichkeit oder Sie können sich gleichwertig vorstellen, dass jede Ihrer Stichproben eine Umfrage unter potenziellen Wählern ist, in der sie gefragt werden, ob sie für den Kandidaten stimmen würden. Somit ist die MLE von gegeben durch:π π
wo
Der Standardfehler für Ihre Schätzung ist:
Das Obige kann durch Verwendung des MLE für angenähert werden, dh durch:π
quelle