Wiederholte Messungen über die Zeit mit kleinen

14

Ich erhielt Daten zur Analyse für eine Studie, in der die Auswirkungen einer Behandlung auf den Eisenspiegel zu vier verschiedenen Zeitpunkten untersucht wurden (vor der Behandlung endete die Tagesbehandlung, 4 Wochen nach der Behandlung und 2-4 Monate nach der Behandlung). Es gibt keine Kontrollgruppe. Sie prüfen, ob die Eisenspiegel zu jedem der drei Zeitpunkte nach der Behandlung signifikant auf den Stand vor der Behandlung (Basiswert) ansteigen. Elf Patienten hatten Ausgangswerte, aber nur 8 Patienten hatten vollständige Daten für alle 4 Zeitpunkte ( = 11, 10, 9 und 8 für jeden Zeitpunkt). Es wurden nicht nur die Eisenspiegel gemessen, sondern zu jedem Zeitpunkt wurden zwei weitere Labormaßnahmen getroffen, um sie mit dem Ausgangswert zu vergleichen.n

Ich habe ein paar Fragen, wie ich das analysieren soll. Ich dachte zuerst, eine RM-ANOVA wäre angemessen, um diese Daten zu analysieren, war jedoch besorgt über die geringe Stichprobengröße, den Datenverlust und die nicht normale Verteilung der Daten. Dann überlegte ich, jede Nachbehandlungsmaßnahme mit Wilcoxon-Signed-Rank-Tests mit dem Ausgangswert zu vergleichen, stieß dann aber auf mehrere Vergleiche. Ich habe jedoch einige Literatur gelesen, die heruntergespielt werden muss, um mehrere Vergleiche durchzuführen. Insgesamt habe ich es also mit kleinen Stichprobengrößen, unvollständigen Daten und mehreren Vergleichen zu tun (und ob dies notwendig ist oder nicht).

Ich hoffe das alles hat Sinn ergeben. Ich bin neu bei CrossValidated und wurde von einem Kollegen hierher geleitet, um von erfahrenen Statistikern zu lernen. Ich würde mich über jeden Rat freuen! Vielen Dank!


Bearbeitet, um Rohdaten aus dem Kommentar hinzuzufügen:

Es gibt insgesamt vier Zeitpunkte und die Ergebnisvariable ist kontinuierlich. Zum Beispiel sehen die Ergebnisse zu jedem Zeitpunkt ungefähr so ​​aus:

 Baseline (n=11): [2, 7, 7, 3, 6, 3, 2, 4, 4, 3, 14] 
 1st Post (n=10): [167, 200, 45, 132, ., 245, 199, 177, 134, 298, 111]
 2nd Post (n=9):  [75, 43, 23, 98, 87, ., 300, ., 118, 202, 156]
 3rd Post (n=8):  [23, 34, 98, 112, ., 200, ., 156, 54, 18, .]
msturm17
quelle
1
Wenn Sie reproduzierbare Beispiele (oder Rohdaten) hinzufügen, wäre dies hilfreich.
Ladislav Naďo
Die Ergebnisvariable ist stetig. Beispielsweise sehen die Ergebnisse zu jedem Zeitpunkt ähnlich aus: Grundlinienpegel n = 11: [2, 7, 7, 3, 6, 3, 2, 4, 4, 3, 14]. 1st Post n = 10 [167, 200, 45, 132,., 245, 199, 177, 134, 298, 111]. 2. Beitrag n = 9 [75, 43, 23, 98, 87,., 300,., 118, 202, 156]. 3rd Post Level n = 8 [23, 34, 98, 112,., 200,., 156, 54, 18,.]. Es gibt insgesamt vier Zeitpunkte.
msturm17

Antworten:

5

Ich habe Ihr Problem überarbeitet und Friedmans Test gefunden, der eine nicht parametrische Version einer Einweg-ANOVA mit wiederholten Messungen ist .

Ich hoffe, Sie haben Grundkenntnisse R.

# Creating a source data.frame
my.data<-data.frame(value=c(2,7,7,3,6,3,2,4,4,3,14,167,200,45,132,NA,
245,199,177,134,298,111,75,43,23,98,87,NA,300,NA,118,202,156,23,34,98,
112,NA,200,NA,156,54,18,NA),
post.no=rep(c("baseline","post1","post2","post3"), each=11),
ID=rep(c(1:11), times=4))

# you must install this library
library(pgirmess)

Test durchführen Friedmans Test ...

friedman.test(my.data$value,my.data$post.no,my.data$ID)

    Friedman rank sum test

data:  my.data$value, my.data$post.no and my.data$ID
Friedman chi-squared = 14.6, df = 3, p-value = 0.002192

und dann durch nicht-parametrischen Post-Hoc-Test herausfinden, zwischen welchen Gruppen der Unterschied besteht . Hier haben Sie alle möglichen Vergleiche.

friedmanmc(my.data$value,my.data$post.no,my.data$ID)
Multiple comparisons between groups after Friedman test 
p.value: 0.05 
Comparisons
               obs.dif critical.dif difference
baseline-post1      25     15.97544       TRUE
baseline-post2      21     15.97544       TRUE
baseline-post3      20     15.97544       TRUE
post1-post2          4     15.97544      FALSE
post1-post3          5     15.97544      FALSE
post2-post3          1     15.97544      FALSE

Wie Sie sehen können, unterscheidet sich nur die Basislinie (erster Zeitpunkt) statistisch von anderen.

Ich hoffe, dies wird dir helfen.

Ladislav Naďo
quelle
1
Ladislav, das ist eine hervorragende Antwort auf diese Frage. Es ist äußerst gründlich und vollständig. Das einzige Problem, das ich sehe, ist, dass Kruskal-Wallis-ANOVAs auch die Unabhängigkeit von Beobachtungen voraussetzen, so dass es auf jeder Ebene der unabhängigen Variablen verschiedene Subjekte gibt, die wir in diesem Fall nicht haben, da wir derselben folgen 11 Patienten über 4 Zeitpunkte. Haben Sie eine Meinung dazu oder haben Sie andere Methoden, um dieses Problem anzugehen? Vielen Dank!
Matt Reichenbach
Ich habe meinen Kommentar oben gelöscht. Ich habe endlich einen besseren Test gefunden. Genießen !
Ladislav Naďo
Dies ist nicht meine ursprüngliche Frage, @ msturm17, muss deine Antwort akzeptieren, ich habe dir jedoch das Kopfgeld gegeben!
Matt Reichenbach
Vielen Dank, Ladislav, dass Sie sich die Zeit genommen haben, meine Frage gründlich zu beantworten!
msturm17
2

Wenn Sie die Verteilung der einzelnen Änderungen über die Zeit nicht kennen, können Sie sie nicht mit der Verteilung der Unterschiede zwischen Patienten approximieren. Wenn Sie beispielsweise 10 Patienten mit entsprechenden Eisenwerten (510.520, ..., 600) vor der Behandlung und (520.530, ..., 610) nach der Behandlung haben, würde die Kruskal-Wallis-ANOVA (oder ein ähnlicher Algorithmus) dies beanspruchen dass es keine signifikante Änderung des Eisengehalts gibt.

IMHO, ohne die Kontrollgruppe, ist das Beste, was Sie tun können, zu zählen, wie viele Patienten ihren Eisenspiegel erhöht und wie viele ihn gesenkt haben, und die Signifikanz davon zu testen.

Das heißt, wenn die KW ANOVA Ihnen sagt, dass es einen signifikanten Eisengehalt gibt, ist dies (keine falschen Positiven).

user31264
quelle
1
Ja, keine Fehlalarme! Haha, danke für deine Antwort. Wie schlagen Sie vor, dass wir die Signifikanz davon testen, um zu zählen, wie viele Patienten ihren Eisenspiegel erhöht und wie viele ihn gesenkt haben? Vielen Dank!
Matt Reichenbach
2
mnp=2(m+n)k=0m(m+nk)
Vielen Dank! Dies war eine weitere interessante Möglichkeit, meine Frage zu betrachten und zu sehen, wie sie auf meine Daten zutrifft.
msturm17