Wie kann ich das Konfidenzintervall eines Mittelwerts in einer nicht normalverteilten Stichprobe berechnen?
Ich verstehe, dass hier häufig Bootstrap-Methoden verwendet werden, bin aber offen für andere Optionen. Während ich nach einer nicht parametrischen Option suche, wäre es in Ordnung, wenn mich jemand davon überzeugen könnte, dass eine parametrische Lösung gültig ist. Die Stichprobengröße beträgt> 400.
Wenn jemand eine Probe in R geben könnte, wäre es sehr dankbar.
Antworten:
Zunächst würde ich prüfen, ob der Mittelwert für die jeweilige Aufgabe geeignet ist. Wenn Sie nach einem "typischen / oder zentralen Wert" für eine verzerrte Verteilung suchen, verweist der Mittelwert möglicherweise auf einen eher nicht repräsentativen Wert. Betrachten Sie die logarithmische Normalverteilung:
Der Mittelwert (rote Linie) ist ziemlich weit von der Masse der Daten entfernt. 20% getrimmter Mittelwert (grün) und Median (blau) liegen näher am "typischen" Wert.
Die Ergebnisse hängen von der Art Ihrer "nicht normalen" Verteilung ab (ein Histogramm Ihrer tatsächlichen Daten wäre hilfreich). Wenn es nicht schief ist, aber schwere Schwänze aufweist, sind Ihre CIs sehr breit.
Auf jeden Fall halte ich Bootstrapping in der Tat für einen guten Ansatz, da es Ihnen auch asymmetrische CIs bieten kann. Das
R
Paketsimpleboot
ist ein guter Anfang:... ergibt folgendes Ergebnis:
quelle
kappa = (exp(1)+2)*sqrt( exp(1) - 1) = 6.184877
s = sqrt( (exp(1)-1)*exp(1) ) = 2.161197
2*s*qnorm(0.975)/sqrt(n) = 0.2678999
kappa*s/(6*n) = 0.00222779
kappa
quelle
Versuchen Sie eine logarithmische Normalverteilung und berechnen Sie:
Sie erhalten ein asymmetrisches Konfidenzintervall um den erwarteten Wert (der nicht der Mittelwert der Rohdaten ist).
quelle