Bei T-Tests wird nach den meisten Texten davon ausgegangen, dass die Bevölkerungsdaten normal verteilt sind. Ich verstehe nicht, warum das so ist. Erfordert ein T-Test nicht nur, dass die Stichprobenverteilung der Stichprobenmittel normal verteilt ist und nicht die Population?
Wenn der T-Test letztendlich nur eine Normalität in der Stichprobenverteilung erfordert, kann die Population wie eine Verteilung aussehen, oder? Solange es eine vernünftige Stichprobengröße gibt. Ist es nicht das, was der zentrale Grenzwertsatz besagt?
(Ich beziehe mich hier auf T-Tests mit einer oder unabhängigen Stichproben)
Antworten:
Die t-Statistik besteht aus einem Verhältnis zweier Größen, beide Zufallsvariablen. Es besteht nicht nur aus einem Zähler.
Damit die t-Statistik die t-Verteilung hat, muss nicht nur der Stichprobenmittelwert eine Normalverteilung haben. Du brauchst ausserdem:
dass das im Nenner so ist, dass s 2 / σ 2 ∼ χ 2 d *s s2/ σ2~ χ2d
dass der Zähler und der Nenner unabhängig sind.
* (der Wert von hängt davon ab, welcher Test - in der Einstichprobe t haben wir d = n - 1 )d t d= n - 1
Damit diese drei Dinge tatsächlich zutreffen, müssen die Originaldaten normal verteilt sein.
Nehmen wir für einen Moment iid als gegeben. Damit das CLT die Bevölkerung hält, muss es den Bedingungen entsprechen ... - Die Bevölkerung muss eine Verteilung haben, für die das CLT gilt. Also nein, da es Bevölkerungsverteilungen gibt, für die das CLT nicht gilt.
Nein, das CLT sagt eigentlich kein einziges Wort über "angemessene Stichprobengröße".
Es sagt eigentlich gar nichts darüber aus, was bei einer endlichen Stichprobengröße passiert.
Sie haben also zwei Probleme:
A. Der Effekt, den Menschen normalerweise der CLT zuschreiben - die zunehmend engere Annäherung an die Normalität der Verteilung der Stichprobenmittel bei kleinen / mittleren Stichprobengrößen - ist in der CLT ** nicht angegeben.
B. "Etwas, das im Zähler nicht so weit vom Normalen entfernt ist" reicht nicht aus, um die Statistik mit einer t-Verteilung zu erhalten
** (Etwas wie das Berry-Esseen-Theorem lässt Sie eher sehen, was die Leute sehen, wenn sie die Auswirkung einer Erhöhung der Stichprobengröße auf die Verteilung der Stichprobenmittel betrachten.)
quelle