Wie sollte man in einer randomisierten kontrollierten Studie die Gruppen- und Einzelunterschiede in den Ergebnissen vor der Behandlung kontrollieren?

9

Andrew Gelman schreibt in dem Buch, das er mit Jennifer Hill schrieb, in Kapitel 9 (Abschnitt 9.3) auf Seite 177:

Es ist nur angebracht, Prädiktoren vor der Behandlung oder allgemeiner Prädiktoren zu kontrollieren, die von der Behandlung nicht betroffen wären (z. B. Rasse oder Alter). Dieser Punkt wird in Abschnitt 9.7 ...

Und dort (9.7 mit dem Titel "Nicht für Variablen nach der Behandlung kontrollieren") erörtert er das Problem der Messung von Vermittlungsvariablen und nicht das Problem vor dem Wechsel direkt.

Es ist wichtig, hier zu erwähnen, dass ich Gelman / Hill für einen brillanten Text halte ... und ich genieße es sehr, ihn zu verstehen. Dieses bisschen hat jedoch mein Interesse geweckt, da es an Everitt & Pickles 'Herangehensweise an dasselbe Problem erinnert.

Everitt ist der Meinung, dass die Verwendung eines Änderungsscores (Score B - Score A) dazu neigt, Ihre Ergebnisse zugunsten der Behandlung zu beeinflussen, während die Einbeziehung der Baseline-Scores in das Modell konservativer ist. Sie unterstützen dies mit einer Simulation - es ist ziemlich überzeugend.

Mein bisheriges Verständnis war, dass Sie Gruppenunterschiede bei den Basiswerten kontrollieren, die dazu führen können, dass der offensichtliche Behandlungseffekt größer ist als er ist oder existiert, wenn dies nicht der Fall ist. Ich verstehe auch, dass dies darauf zurückzuführen ist, dass eine Regression auf den Mittelwert am Werk ist, so dass höhere Basiswerte unabhängig vom Behandlungseffekt mit größeren Abnahmen verbunden sind und umgekehrt.

Everitt ist energisch gegen "Change Scores", und Gelman scheint davon abzuraten, Baseline Scores in das Modell aufzunehmen.

Gelman demonstriert dies jedoch auf den nächsten 2-3 Seiten, einschließlich der Ergebnisse vor dem Test als Prädiktor. Er gibt den Vorbehalt, dass Sie dann eine Reihe plausibler Behandlungseffekte erhalten, die von der Bewertung vor dem Test abhängig sind, und nicht eine Reihe von Behandlungseffekten, die lediglich eine Unsicherheit in den Auswirkungen darstellen.

Meiner Meinung nach scheint die Verwendung von "Änderungswerten" nichts gegen die Regression des Mittelwerts zu tun zu haben, wohingegen die Einbeziehung des Basiswerts als Prädiktor die Aufhebung von Unterschieden zwischen Basisgruppen ermöglicht und im Wesentlichen eine Kovarianzstruktur einführt.

Ich bin Arzt und muss echte Entscheidungen darüber treffen, welche Behandlungen funktionieren. Also was soll ich tun? Die Basiswerte jeder Person einschließen oder "Änderungswerte" verwenden?

Rosser
quelle
Natürlich , was U'd ist eigentlich tut es in beiden Richtungen modellieren undw
rosser

Antworten:

5

{Ich betrüge und füge einen zu langen Kommentar für das Kommentarfeld hinzu.} Vielen Dank für Ihre Erklärung. Klingt so, als hätten Sie einige großartige Quellen gefunden und viel getan, um daraus gute Lektionen zu ziehen. Es gibt andere lesenswerte Quellen, z. B. ein Kapitel in Cook und Campbells Quasi-Experiment; ein Abschnitt in Geoffrey Keppels Design und Analyse; und ich denke mindestens einen Artikel von Donald Rubin. Ich werde auch eine Lektion anbieten, die ich aus Damian Betebenners Arbeit über Testergebnisse von Schülern gelernt (umschrieben) habe:

Ist zu erwarten, dass ohne eine bestimmte Intervention keine Verbesserung eintreten würde? In diesem Fall ist es sinnvoll, die Gewinnwerte wie bei der Varianzanalyse zu analysieren. Ist es stattdessen vernünftig zu glauben, dass sich alle Schüler auch ohne die Intervention bis zu einem gewissen Grad verbessern würden und dass ihr Posttest-Score als lineare Funktion ihres Pretest-Scores vorhergesagt werden könnte? In diesem Fall wäre eine Analyse der Kovarianz sinnvoll.

aus dem ANOVA / ANCOVA-Flussdiagramm

Vielleicht wissen Sie das auch, aber Lords Paradoxon, auf das sich Betebenner bezieht, beinhaltet die Möglichkeit, mit denselben Daten ein Ergebnis der mittleren Differenz von Null mit einer dieser beiden Methoden zu erhalten, aber einen signifikanten Unterschied mit der anderen.

Ich gehe davon aus, dass beide Methoden einen Platz haben und dass Everitt und vielleicht auch Gelman, so großartig sie auch sind, in diesem Fall eine zu harte Linie einschlagen.

rolando2
quelle