Wie mache ich eine ANOVA mit Daten, die nach Transformationen noch nicht normal sind?

8

Ich betrachte den Effekt, den Niederlage und Einschluss verursachende Bedingungen auf subjektive Bewertungen von Niederlage und Einschluss zu drei verschiedenen Zeitpunkten (unter anderem) haben.

Die subjektiven Bewertungen sind jedoch nicht normal verteilt. Ich habe mehrere Transformationen durchgeführt und die Squareroot-Transformation scheint am besten zu funktionieren. Es gibt jedoch noch einige Aspekte der Daten, die sich nicht normalisiert haben. Diese Nicht-Normalität manifestiert sich in einer negativen Schiefe unter Bedingungen mit hohem Einschluss und hoher Niederlage zu dem Zeitpunkt, zu dem ich erwartet hatte, dass es die höchsten Niederlagen- und Einschlussbewertungen gibt. Folglich könnte man argumentieren, dass dieser Versatz auf die experimentelle Manipulation zurückzuführen ist.

Wäre es angesichts der mangelnden Normalität angesichts der Manipulationen akzeptabel, ANOVAs für diese Daten durchzuführen? Oder wären nichtparametrische Tests besser geeignet? Wenn ja, gibt es ein nicht parametrisches Äquivalent einer gemischten 4x3-ANOVA?

mpiktas
quelle

Antworten:

15

Es sind die Residuen, die normal verteilt werden sollten, nicht die marginale Verteilung Ihrer Antwortvariablen.

Ich würde versuchen, Transformationen zu verwenden, die ANOVA durchzuführen und die Residuen zu überprüfen. Wenn sie unabhängig von der verwendeten Transformation merklich nicht normal aussehen, würde ich zu einem nicht parametrischen Test wie dem Friedman-Test wechseln.

Rob Hyndman
quelle
1
+1. Bemerkenswert ist, dass es ziemlich einfache formale Verfahren gibt, um Transformationen zu untersuchen, wie z. B. Spread-Level-Plots (beschrieben in Tukeys EDA ).
whuber
3

Ich glaube, bei negativ verzerrten Daten müssen Sie möglicherweise die Daten reflektieren, um positiv verzerrt zu werden, bevor Sie eine andere Datentransformation anwenden (z. B. Protokoll oder Quadratwurzel). Dies erschwert jedoch tendenziell die Interpretation Ihrer Ergebnisse.

Was ist Ihre Stichprobengröße? Je nachdem, wie groß es genau ist, können parametrische Tests ziemlich gute Schätzungen liefern.

Andernfalls können Sie für eine nicht parametrische Alternative möglicherweise den Friedman-Test ausprobieren .

Darüber hinaus können Sie versuchen, eine MANOVA für wiederholte Messungen mit einer expliziten Zeitvariablen als Alternative zu einer gemischten 4x3-ANOVA durchzuführen. Ein wesentlicher Unterschied besteht darin, dass die Annahme der Sphärizität gelockert wird (oder vielmehr für Sie geschätzt wird) und dass alle Zeitpunkte Ihrer Ergebnisvariablen gleichzeitig angepasst werden.

Iris Tsui
quelle
FWIW, jede Box-Cox-Transformation der Leistung größer als 1 verringert den negativen Versatz. Angesichts der Antwort von Rob Hyndman ist dies jedoch nicht das erste, was Sie versuchen sollten.
whuber
2

Eine Boxcox-Transformation (es gibt eine im MASS-Paket) funktioniert sowohl bei negativ als auch bei positiv verzerrten Daten. Zu Ihrer Information, Sie müssen eine Formel in diese Funktion wie y ~ 1 eingeben und sicherstellen, dass y zuerst positiv ist (wenn nicht nur eine Konstante wie abs (min (y)) hinzugefügt wird). Möglicherweise müssen Sie den Lambda-Bereich in der Funktion anpassen, um die Spitze der Kurve zu ermitteln. Sie erhalten den besten Lambda-Wert zur Auswahl und wenden dann einfach diese Transformation an:

b <- boxcox(y~1)
lambda <- b$x[b$y == max(b$y)]
yt <- (y^lambda-1)/lambda
#you can transform back with
ytb <- (t*lambda+1)^(1/lambda)

Überprüfen Sie dann, ob Ihre Daten normal sind.

#you can transform back with
ytb <- (t*lambda+1)^(1/lambda)
#maybe put back the min
ytb <- ytb - abs(min(y))
John
quelle