Ich habe viele Male gelesen / gehört, dass die Stichprobengröße von mindestens 30 Einheiten als "große Stichprobe" angesehen wird (Normalitätsannahmen der Mittelwerte gelten normalerweise ungefähr aufgrund der CLT, ...). Daher generiere ich in meinen Experimenten normalerweise Proben von 30 Einheiten. Können Sie mir bitte einen Hinweis geben, der bei der Verwendung von Stichprobengröße 30 genannt werden sollte?
41
Antworten:
Die Wahl von n = 30 für eine Grenze zwischen kleinen und großen Abtastwerten ist nur eine Faustregel. Es gibt eine große Anzahl von Büchern, die diesen Wert zitieren, zum Beispiel Hogg und Tanis ' Probability and Statistical Inference (7e) sagen "größer als 25 oder 30".
Das heißt, die Geschichte zu mir gesagt wurde , dass der einzige Grund , warum 30 galt als eine gute Grenze war , weil es für ziemlich Student gemacht t Tabellen auf der Rückseite des Lehrbücher passen gut auf einer Seite. Das und die kritischen Werte (zwischen Student's t und Normal) sind ohnehin nur um ungefähr bis zu 0,25 von df = 30 bis df = unendlich versetzt. Für die Handberechnung war der Unterschied eigentlich egal.
Heutzutage ist es einfach, kritische Werte für alle möglichen Dinge mit 15 Dezimalstellen zu berechnen. Darüber hinaus verfügen wir über Resampling- und Permutationsmethoden, für die wir uns nicht einmal auf parametrische Populationsverteilungen beschränken.
In der Praxis verlasse ich mich nie auf n = 30. Zeichne die Daten. Überlagern Sie eine Normalverteilung, wenn Sie möchten. Prüfen Sie visuell, ob eine normale Annäherung angemessen ist (und fragen Sie, ob eine Annäherung überhaupt erforderlich ist). Wenn die Generierung von Stichproben für Forschungszwecke und eine Annäherung obligatorisch ist, generieren Sie eine Stichprobengröße , die ausreicht , um die Annäherung so genau wie gewünscht (oder rechnerisch möglich) zu machen.
quelle
Tatsächlich ist die "magische Zahl" 30 ein Irrtum. Siehe Jakobs Cohens entzückendes Papier, Dinge, die ich bisher gelernt habe ( Am. Psych. December 1990 45 # 12, S. 1304-1312) . Dieser Mythos ist sein erstes Beispiel dafür, wie "manche Dinge, die Sie lernen, nicht so sind".
quelle
IMO, alles hängt davon ab, wofür Sie Ihre Probe verwenden möchten. Zwei "alberne" Beispiele, um zu veranschaulichen, was ich meine: Wenn Sie einen Mittelwert schätzen müssen, sind 30 Beobachtungen mehr als genug. Wenn Sie eine lineare Regression mit 100 Prädiktoren schätzen müssen, reichen 30 Beobachtungen nicht aus.
quelle
Im Allgemeinen benötigt das CLT im Wesentlichen zwei Säulen:
(Beide Zustände können etwas geschwächt sein, aber die Unterschiede sind größtenteils theoretischer Natur.)
quelle