Teilstichprobe einer Zufallsstichprobe: Zufallsstichprobe?

8

Nehmen wir an, Sie haben eine große Zufallsstichprobe von Fußballspielern in Europa, aber Sie interessieren sich nur für das, was in Spanien passiert. Könnten Sie Ihre Stichprobe auf Spieler in Spanien reduzieren und sie dennoch als Zufallsstichprobe (aber einer anderen Bevölkerung) bezeichnen? Wenn nicht, wie würden Sie diese Teilstichprobe nennen und welche besonderen Vorsichtsmaßnahmen sollten Sie treffen, um Rückschlüsse auf die Bevölkerung spanischer Fußballspieler ziehen zu können?

Ich habe das Gefühl, dass die Verwendung dieses Teilmusters in Ordnung wäre, solange es groß genug ist, aber vielleicht fehlt mir etwas.

Antoine Vernet
quelle
3
Beachten Sie, dass dies der Ablehnungsstichprobe vage ähnlich ist. Beachten Sie jedoch bei der von Ihnen beschriebenen Methode, dass Ihre resultierende Stichprobengröße tatsächlich eine Zufallsvariable ist. Je nachdem, welche Art von Analysen Sie im Sinn haben, kann dies zu Komplikationen führen oder auch nicht. Beispielsweise ist in vielen (aber nicht allen) GLMs die Stichprobengröße effektiv zufällig, aber die Inferenz wird bedingt durchgeführt (und dieser Ansatz kann rigoros gerechtfertigt werden).
Kardinal
@cardinal Vielen Dank für den Hinweis auf die Ablehnungsstichprobe. Ich frage mich, welche Art von Komplikationen eingeführt werden würden? Wenn die neue Stichprobe als Zufallsstichprobe einer anderen Population beschrieben werden kann, kann ich dann nicht "virtuell" die Tatsache ignorieren, dass sie durch Resampling erhalten wurde?
Antoine Vernet

Antworten:

2

Im Allgemeinen möchten Sie von einer Stichprobe wirklich "repräsentativ" sein. Zufallsstichproben sind ein guter Weg, da alle Probanden die gleiche Wahrscheinlichkeit haben, Stichproben zu erhalten. In der Hoffnung, dass alle in der Grundgesamtheit vorhandenen Attribute und Attributbeziehungen in der Stichprobe vorhanden sind. Machen Sie es "repräsentativ". Wenn Sie in Ihrem Fall glauben, dass alle spanischen Spieler von vornherein die gleiche Chance hatten, in die (Unter-) Stichprobe gezogen zu werden, ist dies "zufällig".

In Bezug auf Größenüberlegungen: Eine einzelne Beobachtung kann immer noch eine "Zufallsstichprobe" sein. Größere Stichproben werden benötigt, wenn Sie mehr Präzision wünschen, und insbesondere, wenn Sie nach seltenen Beziehungen in der Population suchen, die in einer kleinen Stichprobe möglicherweise nicht vorhanden sind.

JohnRos
quelle
3
Zufälligkeit ist mehr als die gleiche vorherige Chance. Zum Beispiel könnte eine Mannschaft in Spanien zufällig ausgewählt worden sein. Bei gleicher Mannschaftsgröße haben alle Fußballspieler die gleiche Chance, in die Stichprobe aufgenommen zu werden. Es ist jedoch eine große Herausforderung anzunehmen, dass eine einzelne Mannschaft wirklich für alle Spieler des Landes repräsentativ ist.
whuber
2
(...) aber es ist eine Strecke anzunehmen, dass eine einzelne Mannschaft wirklich repräsentativ für alle Spieler im Land ist ... besonders wenn dieses Land Spanien ist ! :)
Kardinal
2
@ whuber- du hast recht. Um genau zu sein, nicht nur gleiche vorherige Chancen, sondern auch gleiche Chancen für den Rest der Stichprobe. Dies schließt das Team-Sampling-Schema aus.
JohnRos
@ JohnRos. Vielen Dank für die Genauigkeit der Beziehung zwischen Zufälligkeit und Repräsentativität.
Antoine Vernet
@whuber Danke für den Hinweis, dass gleiche vorherige Chancen notwendig, aber nicht ausreichend sind.
Antoine Vernet
1

Unter der Annahme, dass die Stichprobenmethode keine Verzerrungen aufweist, sollte dies in Ordnung sein. Einige Fragen könnten sein:

-> Wurde die Umfrage auf Anfrage auf Spanisch durchgeführt? (Sprachverzerrung) -> Wurde die Umfrage telefonisch oder persönlich durchgeführt? Wenn über das Telefon und Mobiltelefone ausgeschlossen wurden, besitzen spanische Spieler mehr oder weniger wahrscheinlich Mobiltelefone als Spieler im übrigen Europa, und aus welchen Gründen? -> War die Rate, mit der spanische Spieler sich weigerten, Umfragefragen zu beantworten, anders als die Rate für Spieler insgesamt? -> Welcher Anteil der spanischen Spieler wurde insgesamt befragt?

Ohne die genaue Zusammensetzung der Daten zu kennen, ist es schwer, mehr zu sagen. Gibt es spezielle Probleme, die Sie betreffen?

John Doucette
quelle
Ich stimme den von Ihnen gemachten Punkten zu , aber wo steht, dass die Spieler kontaktiert wurden oder versucht wurden, kontaktiert zu werden? Das OP könnte beispielsweise nur einige zusammenfassende Statistiken für eine zufällige Untergruppe von Spielern aus Europa haben.
Kardinal
@ John Doucette Danke. Diese Vorsichtsmaßnahmen sind für mich sinnvoll, aber genau genommen handelt es sich nicht um statistische Vorsichtsmaßnahmen, sondern um Design-Vorsichtsmaßnahmen. Dies lässt mich glauben, dass Sie bei der Auswahl von Personen in dieser Subpopulation in Ihrer Stichprobe eine Zufallsstichprobe erhalten, vorausgesetzt, es gibt keine bekannte Verzerrung für die Subpopulation . Was die Daten betrifft, ist das Beispiel fiktiv. Ich habe nur versucht, mich von den Kindern in Klassenzimmern in Schulen zu lösen.
Antoine Vernet