Tests wie Z, t und einige andere gehen davon aus, dass die Daten auf einer Zufallsstichprobe basieren. Warum?
Angenommen, ich mache experimentelle Forschungen, bei denen mir die interne Gültigkeit viel mehr am Herzen liegt als die externe. Also, wenn meine Stichprobe ein bisschen voreingenommen sein könnte, okay, da ich zugestimmt habe, die Hypothese nicht für die gesamte Population abzuleiten. Und die Gruppierung wird immer noch zufällig sein, dh ich werde die Probenteilnehmer der Einfachheit halber auswählen, aber ich werde sie zufällig verschiedenen Gruppen zuordnen.
Warum kann ich diese Annahme nicht einfach ignorieren?
Antworten:
Wenn Sie keinen Rückschluss auf eine größere Gruppe als Ihre tatsächliche Stichprobe ziehen, werden in erster Linie keine statistischen Tests angewendet, und die Frage nach der "Verzerrung" stellt sich nicht. In diesem Fall berechnen Sie nur die bekannten deskriptiven Statistiken Ihrer Stichprobe. In ähnlicher Weise gibt es in diesem Fall keine Frage der "Gültigkeit" des Modells - Sie beobachten lediglich Variablen und zeichnen deren Werte sowie Beschreibungen von Aspekten dieser Werte auf.
Wenn Sie sich dazu entschließen, über Ihre Stichprobe hinauszugehen, um Rückschlüsse auf eine größere Gruppe zu ziehen, benötigen Sie Statistiken und müssen Probleme wie Stichprobenverzerrung usw. berücksichtigen Schlussfolgerungen der breiteren Interessensgruppe. Wenn Sie keine Zufallsstichprobe haben (und die Wahrscheinlichkeiten Ihrer Stichproben in Abhängigkeit von der Grundgesamtheit nicht kennen), ist es schwierig / unmöglich, verlässliche Rückschlüsse auf die Grundgesamtheit zu ziehen.
quelle
In der realen wissenschaftlichen Forschung ist es ziemlich selten, dass Daten aus echten Zufallsstichproben stammen. Bei den Daten handelt es sich fast immer um Bequemlichkeitsproben. Dies wirkt sich hauptsächlich auf die Population aus, auf die Sie verallgemeinern können. Das heißt, auch wenn es sich um eine Convenience-Stichprobe handelt, die von irgendwoher stammt, müssen Sie sich nur darüber im Klaren sein, wo und welche Einschränkungen dies impliziert. Wenn Sie wirklich der Meinung sind, dass Ihre Daten für nichts repräsentativ sind, lohnt sich Ihre Studie auf keiner Ebene, aber das ist wahrscheinlich nicht wahr 1 . Daher ist es oft sinnvoll, Ihre Proben als von irgendwoher gezogen zu betrachten und diese Standardtests zumindest in einem abgesicherten oder qualifizierten Sinne zu verwenden.
Es gibt jedoch eine andere Testphilosophie, die besagt, dass wir uns von diesen Annahmen und den darauf basierenden Tests entfernen sollten. Tukey war ein Verfechter davon. Stattdessen wird die meiste experimentelle Forschung als (intern) gültig angesehen, da die Lerneinheiten (z. B. Patienten) zufällig den Armen zugewiesen wurden. Vor diesem Hintergrund können Sie Permutationstests verwenden , bei denen meist nur davon ausgegangen wird, dass die Randomisierung korrekt durchgeführt wurde. Das Gegenargument, um sich zu viele Sorgen darüber zu machen, ist, dass Permutationstests in der Regel dasselbe wie die entsprechenden klassischen Tests zeigen und mehr Arbeit erfordern. Auch hier können Standardtests akzeptabel sein.
1. In diesem Sinne kann es hilfreich sein, meine Antwort hier zu lesen: Identifizierung der Population und der Stichproben in einer Studie .
quelle
Tests wie Z, t und einige andere basieren auf bekannten Stichprobenverteilungen der relevanten Statistiken. Diese allgemein verwendeten Stichprobenverteilungen werden für die aus einer Zufallsstichprobe berechnete Statistik definiert.
Es kann manchmal möglich sein, eine relevante Stichprobenverteilung für nicht-zufällige Stichproben zu erstellen, aber im Allgemeinen ist dies wahrscheinlich nicht möglich.
quelle