Bei der Durchsicht einer Arbeit gaben die Autoren an, "Kontinuierliche Ergebnisvariablen mit einer verzerrten Verteilung wurden unter Verwendung der natürlichen Logarithmen transformiert, bevor t-Tests durchgeführt wurden, um die vorausgesetzten Normalitätsannahmen zu erfüllen."
Ist dies eine akzeptable Methode, um nicht normale Daten zu analysieren, insbesondere wenn die zugrunde liegende Verteilung nicht unbedingt lognormal ist?
Das mag eine sehr dumme Frage sein, aber ich habe das noch nie gesehen ...
Antworten:
Es ist üblich, eine Art von Transformation auf die Normalität anzuwenden (z. B. unter Verwendung von Logarithmen, Quadratwurzeln usw.), wenn Daten angetroffen werden, die nicht normal sind. Während der Logarithmus für verzerrte Daten relativ häufig gute Ergebnisse liefert, gibt es keine Garantie dafür, dass er in diesem speziellen Fall funktioniert. Beachten Sie bei der Analyse der transformierten Daten auch den obigen @ whubers-Kommentar: "Ein t-Test für die Logarithmen ist weder mit einem t-Test für die nicht transformierten Daten noch mit einem nichtparametrischen Test identisch. Der t-Test auf den Logs vergleicht geometrische Daten bedeutet, nicht das (übliche) arithmetische Mittel. "
Anstatt eine Transformation (z. B. Logarithmen) zu wählen, weil sie die meiste Zeit funktioniert, bevorzuge ich die Box-Cox-Prozedur, um eine Transformation anhand der angegebenen Daten auszuwählen. Es gibt jedoch einige philosophische Probleme damit; insbesondere, ob dies die Anzahl der Freiheitsgrade im t-Test beeinflussen soll, da wir bei der Auswahl der zu verwendenden Transformation einige Informationen aus der Stichprobe verwendet haben.
Eine gute Alternative zur Verwendung des t-Tests nach einer Transformation oder eines klassischen nichtparametrischen Tests ist schließlich die Verwendung des Bootstrap- Analogons des t-Tests. Es setzt keine Normalitätsannahme voraus und ist ein Test über die nicht transformierten Mittel (und über nichts anderes).
quelle
Wenn die für die Durchführung eines t-Tests erforderlichen Annahmen nicht erfüllt sind, ist es im Allgemeinen sinnvoller, einen nichtparametrischen Test zu verwenden.
quelle