Welche Referenzen sollten angeführt werden, um die Verwendung von 30 als ausreichend große Stichprobe zu unterstützen?

41

Ich habe viele Male gelesen / gehört, dass die Stichprobengröße von mindestens 30 Einheiten als "große Stichprobe" angesehen wird (Normalitätsannahmen der Mittelwerte gelten normalerweise ungefähr aufgrund der CLT, ...). Daher generiere ich in meinen Experimenten normalerweise Proben von 30 Einheiten. Können Sie mir bitte einen Hinweis geben, der bei der Verwendung von Stichprobengröße 30 genannt werden sollte?

Lan
quelle
2
Ohne Bezugnahme auf die Anzahl der Parameter, die Sie schätzen möchten, oder auf die Art des Modells, mit dem Sie arbeiten, scheint es ziemlich schwierig, eine eindeutige Antwort zu geben.
Chl
2
Die Annahme von n = 30 als Grenze für kleine und große Stichproben wird von keiner statistischen Technik gut unterstützt.
Jibol

Antworten:

37

Die Wahl von n = 30 für eine Grenze zwischen kleinen und großen Abtastwerten ist nur eine Faustregel. Es gibt eine große Anzahl von Büchern, die diesen Wert zitieren, zum Beispiel Hogg und Tanis ' Probability and Statistical Inference (7e) sagen "größer als 25 oder 30".

Das heißt, die Geschichte zu mir gesagt wurde , dass der einzige Grund , warum 30 galt als eine gute Grenze war , weil es für ziemlich Student gemacht t Tabellen auf der Rückseite des Lehrbücher passen gut auf einer Seite. Das und die kritischen Werte (zwischen Student's t und Normal) sind ohnehin nur um ungefähr bis zu 0,25 von df = 30 bis df = unendlich versetzt. Für die Handberechnung war der Unterschied eigentlich egal.

Heutzutage ist es einfach, kritische Werte für alle möglichen Dinge mit 15 Dezimalstellen zu berechnen. Darüber hinaus verfügen wir über Resampling- und Permutationsmethoden, für die wir uns nicht einmal auf parametrische Populationsverteilungen beschränken.

In der Praxis verlasse ich mich nie auf n = 30. Zeichne die Daten. Überlagern Sie eine Normalverteilung, wenn Sie möchten. Prüfen Sie visuell, ob eine normale Annäherung angemessen ist (und fragen Sie, ob eine Annäherung überhaupt erforderlich ist). Wenn die Generierung von Stichproben für Forschungszwecke und eine Annäherung obligatorisch ist, generieren Sie eine Stichprobengröße , die ausreicht , um die Annäherung so genau wie gewünscht (oder rechnerisch möglich) zu machen.


quelle
13
Hier ist eine Seite darüber, wie gut die normale Näherung der t-Verteilung für n = 30 ist. johndcook.com/normal_approx_to_t.html
John D. Cook
41

Tatsächlich ist die "magische Zahl" 30 ein Irrtum. Siehe Jakobs Cohens entzückendes Papier, Dinge, die ich bisher gelernt habe ( Am. Psych. December 1990 45 # 12, S. 1304-1312) . Dieser Mythos ist sein erstes Beispiel dafür, wie "manche Dinge, die Sie lernen, nicht so sind".

n=30.05.47

Carlos Accioly
quelle
2
Schöne Referenz - und genau das Richtige. Danke.
whuber
1
@whuber Erinnerst du dich, welches Papier es war? Die Verbindung ist inzwischen unterbrochen. Vielleicht diese psych.colorado.edu/~willcutt/pdfs/Cohen_1990.pdf , "Dinge, die ich gelernt habe (bisher)"? Das Jahr stimmt mit dem in der URL des defekten Links überein.
Amöbe sagt Reinstate Monica
1
@Amoeba Ich habe dieses Papier gespeichert, als ich es gelesen habe, damit ich bestätigen kann, dass Sie das gewünschte gefunden haben. Ich habe diese Antwort aktualisiert, um ein Zitat zusammen mit Ihrem Link aufzunehmen.
whuber
@ Carlos Accioly Ich habe es mit dem neuen Link aktualisiert, da der vorherige defekt war.
Akshay Bansal
9

IMO, alles hängt davon ab, wofür Sie Ihre Probe verwenden möchten. Zwei "alberne" Beispiele, um zu veranschaulichen, was ich meine: Wenn Sie einen Mittelwert schätzen müssen, sind 30 Beobachtungen mehr als genug. Wenn Sie eine lineare Regression mit 100 Prädiktoren schätzen müssen, reichen 30 Beobachtungen nicht aus.

bhm
quelle
9

μ¯(n)

Im Allgemeinen benötigt das CLT im Wesentlichen zwei Säulen:

  1. Dass die Zufallsvariablen unabhängig sind: dass Sie Ihre Beobachtungen neu ordnen können, ohne Informationen zu verlieren *.
  2. Dass der rv aus einer Verteilung mit endlichen Sekundenmomenten stammt: Dies bedeutet, dass die klassischen Schätzer von Mittelwert und sd mit zunehmender Stichprobengröße tendenziell zusammenlaufen.

(Beide Zustände können etwas geschwächt sein, aber die Unterschiede sind größtenteils theoretischer Natur.)

user603
quelle
6
Ihr Beispiel zeigt den Wert robuster Statistiken. Der Stichprobenmedian schätzt den Standortparameter einer Cauchy-Verteilungsvertiefung. Man könnte argumentieren, dass das schwächste Glied bei der Verwendung eines T-Tests mit 30 Stichproben der T-Test ist, nicht die 30 Stichproben.
John D. Cook
1
John:> "Man könnte argumentieren, dass das schwächste Glied bei der Verwendung eines T-Tests mit 30 Stichproben der T-Test ist, nicht die 30 Stichproben." Sehr wahr, und auch die Annahme, dass die Daten iid sind . Der Median ist auch MLE für Cauchy-verteilte Zufallsvariablen (und daher effizient), aber im Allgemeinen könnten Sie mehr als 30 Beobachtungen benötigen.
user603
1
Nicht alle Versionen des CLT setzen eine identische Verteilung voraus, auch nicht die Unabhängigkeit. Die grundlegenden diejenigen undergrads gelehrt oft tun, aber es gibt Versionen , die beide Annahmen nicht das machen , zB Lyapunov CLT nimmt an Unabhängigkeit , aber nicht identische Verteilungen und die Unabhängigkeit Zustand auch gelockert werden können, zum Beispiel hier sehen . Diese "Neuordnung" ist auch nicht dasselbe wie Unabhängigkeit. Einige Formen der Abhängigkeit beruhen nicht auf Ordnung.
Glen_b
2
Eine Stichprobengröße von 50.000 reicht nicht aus, damit die CLT gut genug funktioniert, um ein Konfidenzintervall für den Mittelwert einer logarithmischen Normalverteilung zu berechnen.
Frank Harrell