Gepaarte ANOVA mit wiederholten Messungen oder ein gemischtes Modell?

Ich wurde gebeten, einige Daten aus einer klinischen Studie zu analysieren, in der zwei Methoden zur Messung des Blutdrucks untersucht wurden. Ich habe Daten von 50 Probanden mit jeweils zwischen 2 und 57 Messungen mit jeder Methode.

Ich frage mich, wie ich am besten vorgehen soll.

Offensichtlich brauche ich eine Lösung, die die Tatsache berücksichtigt, dass das Blutdruckmaß gepaart ist (zwei Methoden werden gleichzeitig gemessen) und auch eine zeitlich variierende Kovariate (mit einer unterschiedlichen Anzahl von Beobachtungen pro Patient) sowie intra- und inter- Variabilität des Patienten.

Ich habe darüber nachgedacht, dies irgendwie in ANOVA mit wiederholten Maßnahmen umzuwandeln, aber ich denke, es muss möglicherweise ein gemischter Modellansatz sein.

Ich würde mich über hilfreiche Ratschläge freuen.

Ich bin ein absoluter R-Neuling, aber sehr aufgeregt, Fähigkeiten zu entwickeln, und ich habe eine moderate Erfahrung in Stata, so dass ich immer darauf zurückgreifen kann.

r anova mixed-model stata Sam
quelle

Ich glaube nicht, dass Sie mit RM-ANOVA einfach das tun können, was Sie wollen, da die Anzahl der Wiederholungen nicht für alle Fächer gleich ist. Das Ausführen von Modellen mit gemischten Effekten ist in R sehr einfach. Wenn Sie ein wenig Zeit investieren, um die Grundlagen und Befehle zu erlernen, eröffnen sich Ihnen viele Möglichkeiten. Ich finde auch gemischte Modellierung viel einfacher zu verwenden und flexibler und muss RM-ANOVA fast nie direkt durchführen. Bedenken Sie schließlich, dass Sie mit gemischter Modellierung auch die Kovarianzstruktur der Residuen berücksichtigen können (RM-ANOVA nimmt einfach eine diagonale Struktur an), was für viele Anwendungen wichtig sein kann.

Es gibt zwei Hauptpakete für die lineare gemischte Modellierung in R: nlmeund lme4. Das lme4Paket ist das modernere, das sich hervorragend für große Datenmengen und auch für Fälle eignet, in denen Sie mit Clusterdaten arbeiten. Nlmeist das ältere Paket und wird meistens zugunsten von veraltet lme4. Für Konstruktionen mit wiederholten Messungen ist es jedoch immer noch besser als, lme4da Sie nur nlmedie Kovarianzstruktur der Residuen modellieren können. Die grundlegende Syntax von nlmeist sehr einfach. Beispielsweise:

fit.1 <- lme(dv ~ x + t, random=~1|subject, cor=corCompSymm())

Hier modelliere ich die Beziehung zwischen einer abhängigen Variablen dvund einem Faktor xund einer zeitbezogenen Kovariate t. Subjectist ein zufälliger Effekt und ich habe eine zusammengesetzte Symmetriestruktur für die Kovarianz der Residuen verwendet. Jetzt können Sie die berüchtigten p-Werte leicht erhalten, indem Sie:

anova(fit.1)

Abschließend kann ich Ihnen vorschlagen, mehr über nlme anhand des endgültigen Referenzhandbuchs Mixed Effects Models in S und S-Plus zu lesen . Eine weitere gute Referenz für Anfänger sind lineare gemischte Modelle - ein praktischer Leitfaden mit statistischer Software , der viele Beispiele für verschiedene Anwendungen der gemischten Modellierung mit Code in R, SAS, SPSS usw. zusammenstellt.

AlefSin
quelle

Eine weitere gute einleitende Referenz ist Gelman und Hill, Datenanalyse mit Regression und mehrstufigen / hierarchischen Modellen

wolf.rauch

Danke Alef - diese beiden Referenzen sind großartig - genau wie Wolfs oben. Ich frage mich, ob ich meine Frage in Bezug auf die Strukturierung des Modells etwas erweitern kann. Ich kann den DVD nicht identifizieren !! Ich habe zwei Sätze von Blutdruckmessungen (zwei Methoden) sowie Patienten-ID und Beobachtungszeitpunkt. Wie kann ich den Unterschied zwischen den beiden Blutdruckmessungen modellieren (analog zu einem t-Test mit einer Stichprobe, bei dem der Unterschied = 0 ist)? Tut mir leid, Sie zu verfolgen - ich werde jetzt mit meiner Lektüre weitermachen!

Sam

Mach dir keine Sorgen - ich glaube, ich habe es herausgefunden !!! Ich hatte meine Daten im falschen Format. Als ich es endlich herausfand und in ein langes Format manipulierte, machten all diese Beiträge viel mehr Sinn !! Nochmals vielen Dank an alle.

Sam

Ich bin froh, dass du es herausgefunden hast. Es scheint, dass die meisten Pakete in R in der Regel mit Daten im Langformat arbeiten.

AlefSin

Gepaarte ANOVA mit wiederholten Messungen oder ein gemischtes Modell?

Antworten: