Können nicht-zufällige Stichproben mit statistischen Standardtests analysiert werden?

24

Viele klinische Studien basieren auf nicht zufälligen Stichproben. Die meisten Standardtests (z. B. t-Tests, ANOVA, lineare Regression, logistische Regression) basieren jedoch auf der Annahme, dass Stichproben "Zufallszahlen" enthalten. Sind die Ergebnisse gültig, wenn diese nicht-zufälligen Stichproben durch Standardtests analysiert wurden? Vielen Dank.

KuJ
quelle

Antworten:

20

Es gibt zwei allgemeine Modelle zum Testen. Das erste Modell, das auf der Annahme einer Zufallsstichprobe aus einer Population basiert, wird üblicherweise als "Populationsmodell" bezeichnet.

Für den T-Test mit zwei unabhängigen Stichproben nehmen wir beispielsweise an, dass die beiden Gruppen, die wir vergleichen möchten, Zufallsstichproben aus den jeweiligen Populationen sind. Unter der Annahme, dass die Verteilungen der Scores innerhalb der beiden Gruppen normal in der Population verteilt sind, können wir dann die Stichprobenverteilung der Teststatistik (dh für die t-Statistik) analytisch ableiten. Die Idee ist, dass wir diese Stichprobenverteilung für die Teststatistik erhalten würden, wenn wir diesen Prozess unendlich oft wiederholen würden (zwei Stichproben aus der jeweiligen Population werden zufällig gezogen) (das tun wir natürlich nicht wirklich).

Ein alternatives Modell zum Testen ist das "Randomisierungsmodell". Hier müssen wir uns nicht auf Stichproben berufen. Stattdessen erhalten wir eine Randomisierungsverteilung durch Permutationen unserer Stichproben.

Für den t-Test haben Sie beispielsweise Ihre beiden Stichproben (nicht unbedingt per Zufallsstichprobe). Wenn es tatsächlich keinen Unterschied zwischen diesen beiden Gruppen gibt, dann ist es willkürlich, ob eine bestimmte Person tatsächlich zu Gruppe 1 oder Gruppe 2 "gehört". Was wir also tun können, ist, die Gruppenzuweisung immer wieder zu permutieren und dabei jedes Mal zu bemerken, wie weit die Mittelwerte der beiden Gruppen voneinander entfernt sind. Auf diese Weise erhalten wir empirisch eine Stichprobenverteilung. Wir können dann vergleichen, wie weit die beiden Mittelwerte in den ursprünglichen Stichproben voneinander entfernt sind (bevor wir begonnen haben, die Gruppenzugehörigkeiten neu zu mischen), und wenn dieser Unterschied "extrem" ist (dh in die Schwänze der empirisch abgeleiteten Stichprobenverteilung fällt), dann schließen wir Diese Gruppenzugehörigkeit ist nicht willkürlich und es gibt tatsächlich einen Unterschied zwischen den beiden Gruppen.

In vielen Situationen führen die beiden Ansätze tatsächlich zu derselben Schlussfolgerung. In gewisser Weise kann der auf dem Populationsmodell basierende Ansatz als eine Annäherung an den Randomisierungstest angesehen werden. Interessanterweise schlug Fisher das Randomisierungsmodell vor und schlug vor, dass es die Grundlage für unsere Schlussfolgerungen sein sollte (da die meisten Stichproben nicht per Zufallsstichprobe gewonnen werden).

Ein schöner Artikel, der den Unterschied zwischen den beiden Ansätzen beschreibt, ist:

Ernst, MD (2004). Permutationsmethoden: Eine Basis für exakte Schlussfolgerungen. Statistical Science, 19 (4), 676 & ndash; 685 (Link) .

Ein weiterer Artikel, der eine schöne Zusammenfassung bietet und vorschlägt, dass der Randomisierungsansatz die Grundlage für unsere Schlussfolgerungen sein sollte:

Ludbrook, J. & Dudley, H. (1998). Warum Permutationstests den t- und F-Tests in der biomedizinischen Forschung überlegen sind. American Statistician, 52 (2), 127-132 (Link) .

EDIT: Ich sollte auch hinzufügen, dass es üblich ist, bei Verwendung des Randomisierungsansatzes dieselbe Teststatistik zu berechnen wie beim Populationsmodell. Um beispielsweise die Differenz der Mittelwerte zwischen zwei Gruppen zu testen, würde man die übliche t-Statistik für alle möglichen Permutationen der Gruppenmitgliedschaften berechnen (wobei sich die empirisch abgeleitete Stichprobenverteilung unter der Nullhypothese ergibt) und dann prüfen, wie extrem Die T-Statistik für die ursprüngliche Gruppenmitgliedschaft befindet sich unter dieser Verteilung.

Wolfgang
quelle
8

Ihre Frage ist sehr gut, hat aber keine eindeutige Antwort.

Die meisten Tests, wie die von Ihnen genannten, basieren auf der Annahme, dass es sich bei einer Stichprobe um eine Zufallsstichprobe handelt, da eine Zufallsstichprobe wahrscheinlich repräsentativ für die Stichprobenpopulation ist. Wenn die Annahme ungültig ist, muss jede Interpretation der Ergebnisse dies berücksichtigen. Wenn die Stichprobe sehr wenig repräsentativ für die Bevölkerung ist, sind die Ergebnisse wahrscheinlich irreführend. Wenn die Stichprobe repräsentativ ist, obwohl sie nicht zufällig ist, sind die Ergebnisse vollkommen in Ordnung.

Die nächste Frage ist dann, wie man entscheiden kann, ob die Nicht-Zufälligkeit in einem bestimmten Fall von Bedeutung ist. Das kann ich nicht beantworten ;-)

Michael Lew
quelle
5

Sie stellen eine sehr allgemeine Frage, daher ist die Antwort nicht für alle Fälle geeignet. Ich kann es jedoch klarstellen. Statistische Tests haben im Allgemeinen mit der beobachteten Verteilung im Vergleich zu einer hypothetischen Verteilung zu tun (sogenannte Nullverteilung oder Nullhypothese oder in einigen Fällen eine alternative Verteilung). Die Proben können nicht zufällig sein, aber der Test, der verabreicht wird, wird auf einen Wert angewendet, der aus den Proben erhalten wird. Wenn diese Variable einige stochastische Eigenschaften haben kann, wird ihre Verteilung mit einer alternativen Verteilung verglichen. Entscheidend ist dann, ob die Teststatistik der Stichprobe für eine andere interessierende Grundgesamtheit gültig ist oder nicht und ob die Annahmen bezüglich der alternativen Verteilung oder der Nullverteilung für die andere interessierende Grundgesamtheit relevant sind.

Iterator
quelle