Ich teste die Mittelgleichheit mit dem Welch-T-Test. Die zugrunde liegende Verteilung ist alles andere als normal (stärker verzerrt als das Beispiel in einer verwandten Diskussion hier ). Ich kann mehr Daten abrufen, möchte aber eine grundsätzliche Methode, um zu bestimmen, inwieweit dies getan werden soll.
- Gibt es eine gute Heuristik für die Beurteilung, dass die Stichprobenverteilung akzeptabel ist? Welche Abweichungen von der Normalität sind am stärksten betroffen?
- Gibt es andere Ansätze - z. B. die Verwendung eines Bootstrap-Konfidenzintervalls für die Stichprobenstatistik - die sinnvoller wären?
Antworten:
Da der t- Test von Normalität ausgeht und Ihre zugrunde liegenden Verteilungen nicht normal sind, kann nicht prinzipiell festgestellt werden, ob die Stichprobenverteilung akzeptabel ist. Wenn die Stichprobengröße jedoch "groß" wird, setzt der zentrale Grenzwertsatz ein und Sie können einen großen Stichproben-Z-Test verwenden, der im Wesentlichen die gleiche Antwort liefert wie ein t -Test, da sich das t der Normalverteilung mit nähert große Proben.
Statistikbücher / Kurse implizieren oft, dass bei einer Stichprobengröße von 25 oder 30 CLT auf nützliche Weise ins Spiel kommt. Ich habe jedoch die Erfahrung gemacht, dass selbst mit Stichprobengrößen in den Hunderten von großen Stichproben-Z-Tests immer noch ziemlich schlechte Ergebnisse erzielt werden können (z. B. mit Zähldaten).
Meiner Meinung nach passt ein Permutationstest gut zu Ihrem Problem. Es sollte die gleiche oder eine bessere Leistung haben als nichtparametrische Dosenprüfungen (z. B. Mann-Whitney), und Sie müssen sich keine Gedanken über das Normalitätsproblem machen. Und es macht Spaß, sie zu schreiben.
quelle