Box-Cox-Transformation für wiederholte Messungen ANOVA (rANOVA) in R.

7

Mein Vorschlag der Lösung

Führen Sie eine Box-Cox-Transformation durch, obwohl Sie wissen, dass Beobachtungen nicht unabhängig sind, und verwenden Sie dann rANOVA, um die Koeffizienten unter Verwendung des Wissens zu bestimmen, dass die Beobachtungen aus dem Entwurf wiederholter Messungen stammen

Was ist ANOVA?

Man könnte die grundlegende Einweganalyse (mit einer diskreten erklärenden Variablen) des Varianace (ANOVA) -Modells als Sonderfall eines linearen Modells mit einer diskreten erklärenden Variablen behandeln.

ANOVA schätzt die Differenz des Mittelwerts der Antwortvariablen zwischen den Ebenen der erklärenden Variablen und gibt die F-Statistik (basierend auf Varianzen, daher der Name) zurück, aus der die statistische Signifikanz der geschätzten Unterschiede (die als Koeffizienten in behandelt werden) abgeleitet werden kann lineares Modell für geeignete Variablencodierung).

Warum verwenden wir die Box-Cox-Transformation?

Aufgrund der Form der F-Statistik ist die Annahme der Unabhängigkeit, Normalität und Homogenität der Varianzen der Residuen erforderlich. Diese Annahmen sind oft nicht erfüllt, und man könnte eine Box-Cox-Transformation unter Verwendung des vollständigen Modells durchführen, um die Antwortvariable so zu transformieren, dass sie eine normalähnlichere Verteilung aufweist.

Problem: Wiederholte Maßnahmen

Manchmal trifft man auf eine Studie, die für wiederholte Messungen ausgelegt ist, und dann ist die spezielle ErrorSchicht erforderlich, um die Blockierung eines Modells zu berücksichtigen. Daher kann die ANOVA mit wiederholter Messung durchgeführt werden (rANOVA), aber wie üblich kann es zu einer nicht normalen Verteilungssituation kommen.

Der Umgang mit wiederholten Messungen scheint ein gelöstes mathematisches Problem zu sein. Darüber hinaus werden Statistiken in der Box-CoxTransformation ausgerüstet , wenn die Normalitätsannahme nicht erfüllt ist, sodass man auch ein Werkzeug hat, um mit Nicht-Normalität umzugehen. Was aber, wenn ein Design blockiert ist, stoßen wir auf eine Art von Beobachtungen mit wiederholten Messungen, und die Antwortvariable stammt nicht aus der Normalverteilung.

Frage

Dann sollte eine Box-Cox-Transformation für die Varianzanalyse mit wiederholten Messungen (rANOVA) durchgeführt werden, die jedoch nicht im statistischen R-Paket implementiert zu sein scheint.

Ich habe versucht, einen Blick auf die Implementierung der MASS::boxcoxFunktion zu werfen ( https://github.com/cran/MASS/blob/master/R/boxcox.R ), aber es erscheint nur eine Methode für den Standard aov(Varianzanalyse) ), die als lineares Modell ( lmKlasse) behandelt wird. Bei wiederholten Messungen aovlistfunktioniert ANOVA (Klasse ) R unter Beispiel nicht

> npk.aov <- aov(yield ~  N*P*K, npk)
> boxcox(npk.aov)
> npk.aovE <- aov(yield ~  N + Error(block), npk)
> boxcox(npk.aovE)
Error in boxcox.default(npk.aovE) : 
  ‘npk.aovE’ does not have both 'qr' and 'y' components
> boxcox(npk.aovE[[3]])
Error in update.default(object, y = TRUE, qr = TRUE, ...) : 
  need an object with call component
> npk.aovE[[3]]$y <- npk$yield
> boxcox(npk.aovE[[3]])
Error in qr.resid(xqr, yt) : 
  'qr' and 'y' must have the same number of rows

Weil die QRZerlegungsmatrix nur 18 Zeilen hat

> nrow(npk.aovE[[3]]$qr$qr)
[1] 18
> NROW(npk.aovE[[3]]$y)
[1] 24

Weiß jemand, wie man einen solchen Algorithmus implementiert, oder hat er ein Paket gesehen, das Box-Cox-Transformation für ANOVA-Wiederholungsmaßnahmen enthält? Ich habe Friedmans Ansatz gesehen, der dem Kruskal-Wallis-Test (nicht parametrische ANOVA) für Beobachtungen mit wiederholten Messungen und sogar den von Tal Galili durchgeführten Post-hoc-Tests ( http: //www.r-statistics) entspricht. com / 2010/02 / post-hoc-analyse-für-friedmans-test-r-code / ) aber dieser ansatz reicht mir nicht aus, da ich die linearen modellkoeffizienten mit einem rangtest nicht erhalten werde, was Friedmans test ist - Ich bin am meisten daran interessiert zu wissen, was der Unterschied zwischen Gruppen in der erklärenden Variablen ist. Vielleicht könnte man einen anderen Ansatz als die Box-Cox-Transformation für ANOVA (rANOVA) mit wiederholten Maßnahmen vorschlagen?

Marcin Kosiński
quelle
Sie sollten sich für die moderne Art der wiederholten Messung entscheiden, bei der es sich um lineare gemischte Modelle handelt. Hier ist ein relevantes Papier: jstor.org/stable/3559673?seq=1#page_scan_tab_contents und ein zugehöriger Cross Validated-Beitrag: stats.stackexchange.com/questions/138766/… (bisher unbeantwortet).
kjetil b halvorsen
1
@kjetilbhalvorsen danke! Ich werde einen Blick darauf werfen und morgen tiefer gehen
Marcin Kosiński

Antworten:

2

Wie @kjetil b Halvorsen schlägt vor , würde ich mit linearen gemischten Modellen gehen: hier relevant ist Papier und Post .

Potockan
quelle