Stellen Sie sich eine Art Auktion vor, bei der Ihnen beispielsweise 1000 potenzielle Kunden präsentiert werden. Basierend auf Informationen zu diesen potenziellen Kunden - Alter, Geschlecht, Rasse, Einkommen, Bildungserfolg und dergleichen - können Sie "bieten", um Ihr Produkt auf einen Bruchteil von ihnen zu setzen, beispielsweise 250. (Ignorieren Sie die Kosten für das Bieten.) An Um Ihre Chancen auf die Auswahl der richtigen Teilmenge zu maximieren, würde ich wahrscheinlich ein Modell der "Sympathie" unseres Produkts verwenden, das mithilfe logistischer Regression erstellt wurde. Ich kann mich gut genug durch diesen Teil fummeln.
Um jedoch bauen das Modell der Produkt likability, muss ich einige Marktforschung tun, die Prüfung der Produktabstand zu den Themen , die wir von der breiten Bevölkerung rekrutieren kann. Das ist eigentlich ziemlich teuer. Darüber hinaus sollte es wahrscheinlich auf die Demografie der Bevölkerung abgestimmt sein, aus der die Perspektiven stammen. Zum Beispiel könnte uns ein faktorielles Design dazu auffordern, Testpersonen zu gleichen Teilen über die Ebenen des Rassenfaktors hinweg zu rekrutieren, wenn wir in Wirklichkeit wahrscheinlich nur sehr wenige amerikanische Ureinwohner treffen, etwa in den 1000 Prospekten, und dies einfach können Entscheide dich in der Regel, überhaupt nicht zu ihnen zu werfen. (Traurig aber wahr.)
Wie soll ein solches Experiment aufgebaut sein? Konkret sind die Entwurfsvariablen alle kategoriale und ordinale Faktoren. Der Gebotsanteil ist ein Eingabeparameter (1/4 im oben genannten Beispiel), ebenso wie die maximale Anzahl von Probanden, die rekrutiert werden können. Es scheint, als wäre vielleicht eine Mischung aus experimentellem Design und Zufallsstichprobe angebracht, aber ich bin offen für alle vernünftigen Vorschläge und Hinweise.
Ich sollte auch beachten, dass es angesichts der wahrscheinlichen geringen Effektgrößen und der kleinen Stichproben-Rekrutierungspools, die wir uns leisten können, unwahrscheinlich ist, dass die Marktforschung statistisch signifikante Regressionskoeffizienten liefert. Eine Überoptimierung des experimentellen Designs ist wahrscheinlich albern, und jedes vernünftigerweise nicht verrückte Verfahren wird ausreichen.
quelle
Antworten:
Ein Ansatz für Ihr Problem ist die Verwendung einer geschichteten Stichprobe. Ein Zweck der Schichtung besteht darin, sicherzustellen, dass bestimmte Domänen (Gruppen) der Bevölkerung in der Stichprobe vertreten sind, die andernfalls für eine gültige Schlussfolgerung zu spärlich dargestellt würden, z. B. aufgrund einer geringen Auswahlwahrscheinlichkeit.
Die Merkmale mit zu geringer Auswahlwahrscheinlichkeit sind die Kandidaten für eine Schichtung, während die Variablen mit einer ausreichend hohen / ausgewogenen Auswahlwahrscheinlichkeit über ihre Kategorien hinweg im Stichprobenentwurf ignoriert werden können. Nachdem Sie die entscheidenden Schichten für Ihre Population und Ihr Modell identifiziert haben , können Sie die Stichprobenentwurfsstrategie darauf aufbauen (dh eine zufällige Stichprobe aus allen relevanten Schichten, um alle "Zellen" zu füllen).
quelle