Ich habe Daten für zwei Gruppen (dh Stichproben), die ich vergleichen möchte, aber die Gesamtstichprobengröße ist klein (n = 29) und stark unausgeglichen (n = 22 gegenüber n = 7).
Diese Daten sind logistisch schwierig und teuer zu erfassen. Daher ist es in diesem Fall nicht hilfreich, mehr Daten als offensichtliche Lösung zu erfassen.
Es wurden verschiedene Variablen gemessen (Abflugdatum, Ankunftsdatum, Migrationsdauer usw.), sodass mehrere Tests durchgeführt wurden, von denen einige sehr unterschiedlich sind (die kleinere Stichprobe weist eine höhere Varianz auf).
Anfänglich führte ein Kollege t-Tests mit diesen Daten durch, und einige waren statistisch signifikant mit P <0,001, ein anderer war mit P = 0,069 nicht signifikant. Einige Proben waren normal verteilt, andere nicht. Einige Tests umfassten große Abweichungen von "gleichen" Abweichungen.
Ich habe mehrere Fragen:
- Sind hier T-Tests angebracht? Wenn nicht, warum? Gilt dies nur für Tests, bei denen die Annahmen von Normalität und Varianzgleichheit erfüllt sind?
- Was ist eine geeignete Alternative? Vielleicht ein Permutationstest?
- Eine ungleiche Varianz erhöht den Fehler vom Typ I, aber wie? und wie wirkt sich die kleine, unausgeglichene Stichprobengröße auf den Typ I-Fehler aus?
quelle
Erstens ist der T-Test, wie Scortchi bereits betont, aufgrund seiner Annahmen zur Verteilung der Daten nicht so gut für Ihre Daten geeignet.
Zu Ihrem zweiten Punkt würde ich eine Alternative zum T-Test vorschlagen. Wenn Ihr Interesse nur an der Tatsache liegt, ob die Verteilungen Ihrer beiden Stichproben gleich sind oder nicht, können Sie auch versuchen, die zweiseitige Version des Wilcoxon-Rang-Summen-Tests zu verwenden. Der Wilcoxon-Rang-Summen-Test ist ein nicht parametrischer Test. Diese Art von Test ist besonders hilfreich, wenn Sie sich über die zugrunde liegende Verteilung Ihrer Daten nicht sicher sind.
Es gibt eine exakte Lösung des Tests für kleine Stichprobengrößen sowie für große Kohorten. Darüber hinaus gibt es auch ein R-Paket, das den Wilcoxon-Rang-Summen-Test realisiert.
Da es sich um einen parameterfreien Test handelt und auch kleine Stichprobengrößen handhabt, sollte der Test für Ihren Testfall gut geeignet sein.
quelle