Hintergrund: Ich präsentiere Kollegen bei der Arbeit am Testen von Hypothesen und verstehe das meiste in Ordnung, aber es gibt einen Aspekt, den ich zu verstehen und anderen zu erklären versuche.
Dies ist, was ich glaube zu wissen (bitte korrigieren, wenn falsch!)
- Statistiken, die normal wären, wenn die Varianz bekannt wäre, folgen einer Verteilung, wenn die Varianz unbekannt ist
- CLT (Central Limit Theorem): Die Stichprobenverteilung des Stichprobenmittelwerts ist für ausreichend großes ungefähr normal (könnte , könnte für stark verzerrte Verteilungen bis zu )30 300
- Die Verteilung kann für Freiheitsgrade als normal angesehen werden
Sie verwenden den Test, wenn:
- Population normal und Varianz bekannt (für jede Stichprobengröße)
- Population normal, Varianz unbekannt und (aufgrund von CLT)
- Populationsbinom, ,n q > 10
Sie verwenden den Test, wenn:
- Population normal, Varianz unbekannt und
- Keine Kenntnisse über Population oder Varianz und , aber die Probendaten sehen normal aus / bestehen Tests usw., sodass die Population als normal angenommen werden kann
So bin ich mit verlassen:
- Für Stichproben und (?) Sind keine Kenntnisse über Population und Varianz bekannt / unbekannt.< ≈ 300
Meine Fragen sind also:
Bei welcher Stichprobengröße können Sie davon ausgehen (bei denen keine Kenntnisse über Populationsverteilung oder Varianz vorliegen), dass die Stichprobenverteilung des Mittelwerts normal ist (dh CLT hat eingesetzt), wenn die Stichprobenverteilung nicht normal aussieht? Ich weiß, dass einige Distributionen benötigen , aber einige Ressourcen scheinen zu sagen, dass der Test immer dann verwendet wird, wenn ...z n > 30
Für die Fälle, bei denen ich mir nicht sicher bin, gehe ich davon aus, dass ich die Daten auf Normalität prüfe. Wenn die Beispieldaten normal aussehen, verwende ich dann den Test (da von einer normalen Grundgesamtheit ausgegangen wird und da ).n > 30
Was ist, wenn die Beispieldaten für Fälle, über die ich nicht sicher bin, nicht normal aussehen? Gibt es Umstände, unter denen Sie noch einen oder -Test verwenden würden, oder möchten Sie immer nichtparametrische Tests transformieren / verwenden? Ich weiß, dass sich die Stichprobenverteilung des Mittelwerts aufgrund von CLT bei einem Wert von dem Normalwert annähert, aber die Stichprobendaten sagen mir nicht, was dieser Wert von ist. Die Probendaten könnten nicht normal sein, während der Probenmittelwert einer Normalen / folgt . Gibt es Fälle, in denen Sie einen nicht-parametrischen Test transformieren / verwenden würden, obwohl die Stichprobenverteilung des Mittelwerts normal / , Sie dies jedoch nicht feststellen konnten? z n n t t
Antworten:
@AdamO ist richtig, Sie verwenden einfach immer dent Test, wenn Sie die Populationsstandardabweichung nicht a priori kennen. Sie müssen sich keine Gedanken darüber machen, wann Sie zum z Test wechseln müssen , da die t Verteilung für Sie wechselt. Insbesondere konvergiert die t Verteilung zur Normalverteilung, so dass es die richtige Verteilung ist, die bei jedem N verwendet wird . N
Es gibt auch hier eine Verwirrung über die Bedeutung der traditionellen Linie beiN= 30 . Es gibt zwei Arten von Konvergenz, über die die Leute sprechen:
Es kann Ihnen helfen, die jüngste Antwort von @ GregSnow hier zu lesen: Interpretation des p-Werts beim Vergleich der Proportionen zwischen zwei kleinen Gruppen in R auch in Bezug auf diese Probleme.
quelle
quelle