Es gibt zwei allgemeine Modelle zum Testen. Das erste Modell, das auf der Annahme einer Zufallsstichprobe aus einer Population basiert, wird üblicherweise als "Populationsmodell" bezeichnet.
Für den T-Test mit zwei unabhängigen Stichproben nehmen wir beispielsweise an, dass die beiden Gruppen, die wir vergleichen möchten, Zufallsstichproben aus den jeweiligen Populationen sind. Unter der Annahme, dass die Verteilungen der Scores innerhalb der beiden Gruppen normal in der Population verteilt sind, können wir dann die Stichprobenverteilung der Teststatistik (dh für die t-Statistik) analytisch ableiten. Die Idee ist, dass wir diese Stichprobenverteilung für die Teststatistik erhalten würden, wenn wir diesen Prozess unendlich oft wiederholen würden (zwei Stichproben aus der jeweiligen Population werden zufällig gezogen) (das tun wir natürlich nicht wirklich).
Ein alternatives Modell zum Testen ist das "Randomisierungsmodell". Hier müssen wir uns nicht auf Stichproben berufen. Stattdessen erhalten wir eine Randomisierungsverteilung durch Permutationen unserer Stichproben.
Für den t-Test haben Sie beispielsweise Ihre beiden Stichproben (nicht unbedingt per Zufallsstichprobe). Wenn es tatsächlich keinen Unterschied zwischen diesen beiden Gruppen gibt, dann ist es willkürlich, ob eine bestimmte Person tatsächlich zu Gruppe 1 oder Gruppe 2 "gehört". Was wir also tun können, ist, die Gruppenzuweisung immer wieder zu permutieren und dabei jedes Mal zu bemerken, wie weit die Mittelwerte der beiden Gruppen voneinander entfernt sind. Auf diese Weise erhalten wir empirisch eine Stichprobenverteilung. Wir können dann vergleichen, wie weit die beiden Mittelwerte in den ursprünglichen Stichproben voneinander entfernt sind (bevor wir begonnen haben, die Gruppenzugehörigkeiten neu zu mischen), und wenn dieser Unterschied "extrem" ist (dh in die Schwänze der empirisch abgeleiteten Stichprobenverteilung fällt), dann schließen wir Diese Gruppenzugehörigkeit ist nicht willkürlich und es gibt tatsächlich einen Unterschied zwischen den beiden Gruppen.
In vielen Situationen führen die beiden Ansätze tatsächlich zu derselben Schlussfolgerung. In gewisser Weise kann der auf dem Populationsmodell basierende Ansatz als eine Annäherung an den Randomisierungstest angesehen werden. Interessanterweise schlug Fisher das Randomisierungsmodell vor und schlug vor, dass es die Grundlage für unsere Schlussfolgerungen sein sollte (da die meisten Stichproben nicht per Zufallsstichprobe gewonnen werden).
Ein schöner Artikel, der den Unterschied zwischen den beiden Ansätzen beschreibt, ist:
Ernst, MD (2004). Permutationsmethoden: Eine Basis für exakte Schlussfolgerungen. Statistical Science, 19 (4), 676 & ndash; 685 (Link) .
Ein weiterer Artikel, der eine schöne Zusammenfassung bietet und vorschlägt, dass der Randomisierungsansatz die Grundlage für unsere Schlussfolgerungen sein sollte:
Ludbrook, J. & Dudley, H. (1998). Warum Permutationstests den t- und F-Tests in der biomedizinischen Forschung überlegen sind. American Statistician, 52 (2), 127-132 (Link) .
EDIT: Ich sollte auch hinzufügen, dass es üblich ist, bei Verwendung des Randomisierungsansatzes dieselbe Teststatistik zu berechnen wie beim Populationsmodell. Um beispielsweise die Differenz der Mittelwerte zwischen zwei Gruppen zu testen, würde man die übliche t-Statistik für alle möglichen Permutationen der Gruppenmitgliedschaften berechnen (wobei sich die empirisch abgeleitete Stichprobenverteilung unter der Nullhypothese ergibt) und dann prüfen, wie extrem Die T-Statistik für die ursprüngliche Gruppenmitgliedschaft befindet sich unter dieser Verteilung.