In unserem Projekt haben wir eine Bevölkerung von mehr als 1000 Personen. Wir haben eine Zufallsstichprobe von 107 Personen ausgewählt, aber dann haben wir festgestellt, dass wir mehr Präzision benötigen. Deshalb möchten wir jetzt eine größere Stichprobe haben.
Das Problem ist, dass die Stichprobe in unserem Fall teuer ist. Daher haben wir darüber nachgedacht, eine weitere Zufallsstichprobe von etwa 50 Personen aus den verbleibenden 900+ Personen auszuwählen und zur ersten Stichprobe hinzuzufügen, um eine größere Stichprobe zu erhalten, ohne von vorne zu beginnen.
Würde diese neue Stichprobe immer noch als zufällig angesehen werden?
Bearbeiten: Wir nehmen diese Stichprobe, um die Verteilung der gesamten Bevölkerung abzuschätzen. Mit der aktuellen Stichprobe erhalten wir jedoch zu viele "Löcher" in unserer Verteilung, was zu scheinbar ungenauen Ergebnissen führt.
quelle
Antworten:
Korrektur
Ich ziehe die vorherige Antwort (unten) als falsch zurück. @Glen_b ist korrekt. Wenn die zweite Stichprobe nicht auf Ergebnissen in der ersten basiert, beträgt die Gesamtwahrscheinlichkeit der Auswahl , genau wie bei einem SRS (Beweis unten). Außerdem können Sie das Ergebnis als SRS behandeln, obwohl die Größe nicht im Voraus festgelegt wurde.nN
Sie haben jedoch angegeben, dass Sie die zweite Probe genommen haben, weil Sie mehr Präzision benötigen. Wenn Sie die Entscheidung nur getroffen haben, weil die Standardfehler für Schätzungen größer als erwartet waren, ist die Verzerrung der endgültigen geschätzten Standardfehler gering (Hansen, Hurwitz und Madow (1953, S. 77-80) (vorausgesetzt, die anfängliche SE selbst) wurden genau geschätzt). In diesem Fall würde ich die Beobachtungen als von einem SRS stammend behandeln. Wenn Sie jedoch die zweite Stichprobe genommen haben, um einen Grenz-p-Wert auf einen kleineren Wert zu reduzieren, ist eine ernsthafte Verzerrung möglich .
Beweis, dass die Auswahlwahrscheinlichkeit n / N ist:
Sei die Auswahlwahrscheinlichkeit in der ersten Stichprobe und sei die bedingte Auswahlwahrscheinlichkeit in der zweiten Stichprobe: . Sei die endgültige Stichprobengröße. Dann ist die Wahrscheinlichkeit der Auswahl einer Beobachtung für die endgültige Stichprobe:p1=n1N p2 p2=n2N−n1 n=n1+n2
Referenz : Hansen, MH, WN Hurwitz und W Madow. 1953. Stichprobenerhebungsmethoden und -theorie. Band I Methoden und Anwendungen. New York: Wiley.
Ursprüngliche Antwort:
Diese Art von Problem tritt in der Praxis häufig auf und die Lösung ist ähnlich.
Wie @David Z impliziert, müssen Sie die Möglichkeit systematischer Unterschiede zwischen der ersten und der zweiten Umfrage und den Stichproben untersuchen.
Die resultierende kombinierte Stichprobe kann zwar als zufällig, aber nicht als einfach zufällig angesehen werden . Die Selektionswahrscheinlichkeiten unterscheiden sich zwischen den beiden Proben, daher muss die Analyse gewichtet werden. Sie berechnen Gewichte wie folgt:Lassen Sie die Nummer in der Bevölkerung sein . Dann ist die Auswahlwahrscheinlichkeit für die ursprüngliche Stichprobe:N
Um in der zweiten Stichprobe ausgewählt zu werden, darf man in der ersten Stichprobe nicht ausgewählt werden. dann in der zweiten ausgewählt werden:
Die Einwaagen wird in Probe 1 und in Probe 2.W=1f1 W=1f2
Zur Veranschaulichung sei angenommen , dann werden die Gewichte in der ersten und der zweiten Probe werden und bzw.N=1020 9.5327 20.4 Diese Berechnungen müssen geändert werden, wenn in keiner der Proben eine Antwort erfolgte.
quelle
Es hängt davon ab, ob eine Annahme über die gleiche Verteilung zwischen den verbleibenden 900+ nach dem ersten Probenahmevorgang und den ursprünglichen 1000+ gehalten werden kann. Wenn möglich, können Sie einen Test über den Mittelwert oder die Heteroskedastizität der interessierenden Parameter durchführen.
quelle
Ich bin mir nicht ganz sicher, wie zufällig diese Stichprobe sein könnte. Ich habe keine großartige Erfahrung mit Statistiken, aber die von Ihnen vorgeschlagene Methode klingt für mich nicht sehr gut. Was ich tun würde, ist, die Stichprobe, die ich aus der gesamten Bevölkerung genommen habe, zurückzusetzen, sie neu zu ordnen und erneut eine Zufallsstichprobe daraus zu ziehen. Oder ich würde einfach eine neue größere Stichprobe aus der Bevölkerung entnehmen und meine Ergebnisse mit der Stichprobe aus dem ersten Versuch vergleichen.
Es könnte eine gute Idee sein, die Einschränkungen zu beschreiben, die Sie haben, z. B. warum Stichproben für Sie teuer sind, damit andere Personen eine ausführlichere Antwort geben können.
quelle