Fehler beim Schätzen der Größe eines Satzes?

9

Angenommen, wir haben eine Menge A und eine Teilmenge B. Wenn wir | A | kennen, können wir | B | berechnen durch Finden der Wahrscheinlichkeit p, dass ein Element, das gleichmäßig zufällig aus A ausgewählt wird, zu B gehört. Insbesondere | A | p = | B |.

Angenommen, wir erzeugen n Elemente von A gleichmäßig zufällig und verwenden diese Daten, um p (Anzahl der Elemente in B geteilt durch n) zu schätzen und damit | B | zu schätzen.

Wie zuverlässig ist diese Schätzung? Dh wie können wir den Fehler berechnen?

Gibt es als Nebenfrage einen Namen für diese Technik? (Es scheint eine mathematische Version der Mark-and-Recapture- Technik zu sein.)

Douglas S. Stones
quelle
1
Es ist eine Binomialschätzung . (Es gibt überhaupt keine Markierung oder Wiedererfassung.
Dies

Antworten:

8

Sie schätzen die Proportionen. Stellen Sie sich der Vollständigkeit halber vor, dass A die Wählerbevölkerung und B die Wählergruppe ist, die für einen bestimmten Kandidaten stimmen. Somit wäre p der Prozentsatz der Wähler, die für diesen Kandidaten stimmen würden. Lassen:

π ist der wahre Prozentsatz der Personen, die für den Kandidaten stimmen würden

Mit anderen Worten:

π=|B||A|

Dann ist jede Ihrer Stichproben eine Bernoulli-Studie mit der Wahrscheinlichkeit oder Sie können sich gleichwertig vorstellen, dass jede Ihrer Stichproben eine Umfrage unter potenziellen Wählern ist, in der sie gefragt werden, ob sie für den Kandidaten stimmen würden. Somit ist die MLE von gegeben durch:ππ

p=nBn

wo

nB ist die Anzahl der Personen, die angegeben haben, dass sie für einen Kandidaten stimmen würden, oder die Anzahl der Elemente, die zur Menge B in Ihrer Stichprobe der Größe .n

Der Standardfehler für Ihre Schätzung ist:

π(1π)n

Das Obige kann durch Verwendung des MLE für angenähert werden, dh durch:π

p(1- -p)n


quelle