Grundlegende Statistikkurse schlagen häufig vor, eine Normalverteilung zu verwenden, um den Mittelwert eines Populationsparameters zu schätzen, wenn die Stichprobengröße n groß ist (typischerweise über 30 oder 50). Die Student-T-Verteilung wird für kleinere Stichprobengrößen verwendet, um die Unsicherheit der Standardabweichung der Stichprobe zu berücksichtigen. Wenn die Stichprobengröße groß ist, liefert die Standardabweichung der Stichprobe gute Informationen zur Standardabweichung der Grundgesamtheit, sodass eine Schätzung der Normalverteilung möglich ist. Ich verstehe das.
Aber warum sollten Sie eine Schätzung verwenden, wenn Sie Ihr Konfidenzintervall genau ermitteln können? Was nützt die Normalverteilung, unabhängig von der Stichprobengröße, wenn es sich nur um eine Schätzung handelt, die Sie mit der T-Verteilung genau erhalten können?
Antworten:
Um den Zusammenhang mit dem Titel zu verdeutlichen, verwenden wir die t-Verteilung nicht, um den Mittelwert (zumindest im Sinne einer Punktschätzung) zu schätzen, sondern um ein Intervall dafür zu konstruieren.
Das ist eine gute Frage (solange wir nicht zu sehr auf "genau" bestehen, da die Annahmen, dass es genau t-verteilt ist, nicht wirklich zutreffen).
Ich halte den Rat allenfalls für irreführend. In einigen Situationen sollte die t-Verteilung immer noch verwendet werden, wenn die Freiheitsgrade viel größer sind.
Wo das Normale eine vernünftige Annäherung ist, hängt von einer Vielzahl von Dingen ab (und hängt so von der Situation ab). Da es jedoch (mit Computern) überhaupt nicht schwierig ist, nur dast , selbst wenn die df sehr groß sind, müsste man sich fragen, warum man sich bei n = 30 Sorgen machen muss, etwas anderes zu tun.
Wenn die Stichprobengröße sehr groß ist, macht es keinen merklichen Unterschied für das Konfidenzintervall, aber ich denke nicht, dass n = 30 immer ausreichend nahe bei „sehr groß“ liegt.
quelle
Es ist ein historischer Anachronismus. Es gibt viele davon in der Statistik.
Wenn Sie keinen Computer hatten, war es schwierig, die T-Distribution zu verwenden, und es war viel einfacher, eine normale Distribution zu verwenden. Sobald die Stichprobengröße groß wird, werden die beiden Verteilungen ähnlich (wie groß "groß" ist, ist eine andere Frage).
quelle
quelle