Sei eine Familie von iid Zufallsvariablen, die Werte in annehmen und einen Mittelwert und eine Varianz . Ein einfaches Konfidenzintervall für den Mittelwert unter Verwendung von ist gegeben durch
Da als normale Zufallsvariable asymptotisch verteilt ist, wird die Normalverteilung manchmal verwendet, um ein ungefähres Konfidenzintervall zu "konstruieren".
In Multiple-Choice-Statistikprüfungen musste ich diese Näherung anstelle von wenn . Ich habe mich immer sehr unwohl gefühlt (mehr als Sie sich vorstellen können), da der Approximationsfehler nicht quantifiziert wird.
Warum die normale Näherung anstelle von ?
Ich möchte die Regel nie wieder blind anwenden . Gibt es gute Referenzen, die mich bei einer Ablehnung unterstützen und geeignete Alternativen anbieten können? ( ist ein Beispiel für eine meiner Meinung nach geeignete Alternative.)
Hier sind und zwar unbekannt, sie sind jedoch leicht zu begrenzen.
Bitte beachten Sie, dass meine Frage eine Referenzanfrage ist, insbesondere zu Konfidenzintervallen, und sich daher von den Fragen unterscheidet, die hier und hier als Teilduplikate vorgeschlagen wurden . Es wird dort nicht beantwortet.
Antworten:
Warum normale Approximation verwenden?
Es ist so einfach wie zu sagen, dass es immer besser ist, mehr Informationen als weniger zu verwenden. Die Gleichung (1) verwendet den Satz von Chebyshev . Beachten Sie, dass es keine Informationen über die Form Ihrer Verteilung verwendet, dh, es funktioniert für jede Verteilung mit einer bestimmten Varianz. Wenn Sie also Informationen über die Form Ihrer Verteilung verwenden, müssen Sie eine bessere Annäherung erhalten. Wenn Sie wissen, dass es sich bei Ihrer Verteilung um eine Gauß-Verteilung handelt, erhalten Sie mit diesem Wissen eine bessere Schätzung.
Da Sie bereits den zentralen Grenzwertsatz anwenden, warum nicht die Gaußsche Approximation der Grenzen verwenden? Sie werden tatsächlich besser, enger (oder schärfer) sein, da diese Schätzungen auf der Kenntnis der Form beruhen, die eine zusätzliche Information darstellt.
Die Faustregel 30 ist ein Mythos, der von der Bestätigungsverzerrung profitiert . Es wird immer wieder von einem Buch in ein anderes kopiert. Einmal fand ich eine Referenz, die diese Regel in einem Artikel aus den 1950er Jahren vorschlug. Es war kein solider Beweis, wie ich mich erinnere. Es war eine Art empirische Studie. Grundsätzlich ist der einzige Grund, warum es verwendet wird, dass es funktioniert. Du siehst es nicht oft böse verletzt.
UPDATE Schlagen Sie in dem Artikel von Zachary R. Smith und Craig S. Wells über " Central Limit Theorem and Sample Size " nach. Sie präsentieren eine empirische Studie zur Konvergenz von CLT für verschiedene Arten von Verteilungen. Die magische Zahl 30 funktioniert natürlich in vielen Fällen nicht.
quelle
Das Problem bei der Verwendung der Chebyshev-Ungleichung, um ein Intervall für den wahren Wert zu erhalten, besteht darin, dass Sie nur eine untere Grenze für die Wahrscheinlichkeit erhalten, die außerdem manchmal trivial ist oder, um nicht trivial zu sein, eine sehr breite Konfidenzintervall. Wir haben
Wir sehen, dass wir, abhängig von der Stichprobengröße, die triviale Antwort "die Wahrscheinlichkeit ist größer als Null" erhalten , wenn wir "zu viel" verringern .ε
Abgesehen davon erhalten wir aus diesem Ansatz eine Schlussfolgerung der Form "", dass die Wahrscheinlichkeit, dass in [ ˉ X ± ε ] fällt, gleich oder größer ist als ... "μ [X¯±ε]
Nehmen wir jedoch an, dass wir damit gut umgehen und bezeichnen die Mindestwahrscheinlichkeit, mit der wir uns wohl fühlen. Also wollen wirpmin
Dies kann bei kleinen Stichprobengrößen und hoher gewünschter Mindestwahrscheinlichkeit ein unbefriedigend breites Konfidenzintervall ergeben. ZB für und n = 100 erhalten wir ε ≈ .316 , was zum Beispiel für die Variable, die von der in [ 0 , 1 ] begrenzten OP behandelt wird , zu groß erscheint, um nützlich zu sein.pm i n= 0,9 n = 100 ε ≈ .316 [ 0 , 1 ]
Der Ansatz ist jedoch gültig und vertriebsfrei, sodass es Fälle geben kann, in denen er nützlich sein kann.
Man kann auch die in einer anderen Antwort erwähnte Vysochanskij-Petunin-Ungleichung prüfen , die für kontinuierliche unimodale Verteilungen gilt und die Ungleichung von Chebyshev verfeinert.
quelle
Die kurze Antwort ist, dass es ziemlich schlecht laufen kann, aber nur, wenn einer oder beide Schwänze der Stichprobenverteilung wirklich fett sind .
Dieser R-Code generiert eine Million Sätze von 30 Gamma-verteilten Variablen und berechnet deren Mittelwert. Es kann verwendet werden, um ein Gefühl dafür zu bekommen, wie die Stichprobenverteilung des Mittelwerts aussieht. Wenn die normale Approximation wie beabsichtigt funktioniert, sollten die Ergebnisse mit Mittelwert 1 und Varianz ungefähr normal sein
1/(30 * shape)
.f = function(shape){replicate(1E6, mean(rgamma(30, shape, shape)))}
Wenn
shape
1.0 ist, wird die Gamma-Verteilung zu einer Exponentialverteilung , was ziemlich unüblich ist. Nichtsdestotrotz sind die nicht-Gaußschen Anteile meistens durchschnittlich und daher ist die Gaußsche Approximation nicht so schlecht:Es gibt eindeutig eine gewisse Voreingenommenheit, und es wäre gut, dies zu vermeiden, wenn dies möglich ist. Aber ehrlich gesagt, wird dieses Vorurteil wahrscheinlich nicht das größte Problem einer typischen Studie sein.
Trotzdem kann es noch viel schlimmer kommen. Mit
f(0.01)
sieht das Histogramm folgendermaßen aus:Das Protokolltransformieren der 30 abgetasteten Datenpunkte vor der Mittelwertbildung ist jedoch sehr hilfreich:
Im Allgemeinen erfordern Verteilungen mit langen Schwänzen (auf einer oder beiden Seiten der Verteilung) die meisten Abtastwerte, bevor die Gaußsche Näherung verlässlich wird. Es gibt sogar pathologische Fälle, in denen es buchstäblich nie genug Daten gibt, damit die Gaußsche Näherung funktioniert, aber in diesem Fall treten wahrscheinlich ernstere Probleme auf (da die Stichprobenverteilung zu Beginn keinen genau definierten Mittelwert oder keine Varianz aufweist) mit).
quelle
Problem mit dem Konfidenzintervall von Chebyshev
Vergleichen der Längen der Konfidenzintervalle
Mit Höffding gebunden
quelle
curve(sqrt(-log(.025)/2/x), to= 100, col= 'red', xlab= 'n', ylab= 'half interval') #Hoeffding ; curve(qnorm(.975, 0, .5/sqrt(x)), to= 100, add= T, col= 'darkgreen') #normal approximation
Beginnen wir mit der Zahl 30: Es ist, wie jeder sagen wird, eine Faustregel. aber wie können wir eine Nummer finden, die besser zu unseren Daten passt? Eigentlich ist es hauptsächlich eine Frage der Schiefe: Selbst die seltsamste Verteilung konvergiert schnell zur Normalität, wenn es sich um symmetrische und kontinuierliche, schiefe Daten handelt, die viel langsamer sind. Ich erinnere mich, dass ich gelernt habe, dass eine Binomialverteilung richtig an die Norm angenähert werden kann, wenn ihre Varianz größer als 9 ist. Für dieses Beispiel ist zu berücksichtigen, dass die diskrete Verteilung auch das Problem hat, dass sie große Zahlen benötigt, um die Kontinuität zu simulieren, aber denken Sie daran: Eine simmetrische Binomialverteilung erreicht diese Varianz mit n = 36, wenn stattdessen p = 0,1, muss n gehen bis zu 100 (variable Transformation würde jedoch viel helfen)!
Wenn Sie stattdessen nur die Varianz verwenden möchten, indem Sie die Gaußsche Näherung fallen lassen und die Vysochanskij-Petunin-Ungleichung über die Chebichev-Ungleichung betrachten, ist die Annahme einer unimodalen Verteilung des Mittelwerts erforderlich als 2.
quelle