Ich stieß auf eine Studie, in der Patienten, die alle über 50 Jahre alt waren, nach Geburtsjahren pseudo-randomisiert wurden. Wenn das Geburtsjahr eine gerade Zahl war, übliche Pflege, wenn eine ungerade Zahl, Intervention.
Es ist einfacher zu implementieren, es ist schwieriger zu untergraben (es ist einfach zu überprüfen, welche Behandlung ein Patient hätte erhalten sollen), es ist leicht zu merken (die Aufgabe dauerte mehrere Jahre). Trotzdem mag ich es nicht. Ich denke, eine richtige Randomisierung wäre besser gewesen. Aber ich kann nicht erklären warum.
Täusche ich mich, wenn ich das fühle, oder gibt es einen guten Grund, 'echte' Randomisierung zu bevorzugen?
experiment-design
clinical-trials
random-allocation
Jeremy Miles
quelle
quelle
Antworten:
Sie haben Recht, skeptisch zu sein. Im Allgemeinen sollte man "echte" Randomisierung verwenden, da man normalerweise nicht alle Kenntnisse über relevante Faktoren (nicht beobachtbare Faktoren) hat. Wenn einer dieser nicht beobachtbaren Faktoren mit einem ungeraden oder einem geraden Alter korreliert, hängt dies auch damit zusammen, ob er behandelt wurde oder nicht. In diesem Fall können wir den Behandlungseffekt nicht identifizieren: Die beobachteten Effekte können auf die Behandlung oder auf die nicht beobachteten Faktoren zurückzuführen sein.
Dies ist kein Problem bei einer echten Randomisierung, bei der keine Abhängigkeit zwischen Behandlung und nicht beobachtbaren Faktoren zu erwarten ist (bei kleinen Stichproben kann dies natürlich der Fall sein).
Um eine Geschichte zu konstruieren, warum dieses Randomisierungsverfahren ein Problem sein könnte, nehmen wir an, dass die Studie nur Probanden umfasste, die zu Beginn des Vietnamkrieges 17/18 Jahre alt waren. Mit 17 gab es keine Chance, eingezogen zu werden (korrigieren Sie mich, wenn ich mich irre), während es diese Chance mit 18 gab. Vorausgesetzt, die Chance war nicht vernachlässigbar und die Kriegserfahrung verändert die Menschen, impliziert dies, dass diese beiden Gruppen Jahre später sind unterschiedlich, obwohl sie nur 1 Jahr auseinander sind. Vielleicht sieht die Behandlung (Droge) so aus, als würde sie nicht wirken, aber weil nur die Gruppe mit Vietnam-Veteranen sie erhalten hat, kann dies tatsächlich an der Tatsache liegen, dass sie bei Menschen mit PTBS (oder anderen damit zusammenhängenden Faktoren) nicht wirkt Veteran sein). Mit anderen Worten, Sie müssen beide Gruppen (Behandlung und Kontrolle) bis auf die Behandlung identisch sein, um den Behandlungseffekt zu identifizieren.
Wenn Sie also nicht ausschließen können, dass es keine unbeobachteten Unterschiede zwischen den Gruppen gibt (aber wie machen Sie das, wenn es nicht beachtet wird?), Ist echte Randomisierung vorzuziehen.
quelle
Es ist eine gute Übung konträre Ansichten von Zeit zu Zeit aufrecht zu erhalten, so ich beginnen lassen , indem Sie ein paar Gründe , bieten sie für diese Form von Pseudo-Randomisierung. Grundsätzlich unterscheidet es sich kaum von jeder anderen Form der systematischen Probenahme, z. B. bei der Entnahme von Proben von Umweltmedien an Feldpunkten oder bei der Probenahme aller anderen Bäume in einem Obstgarten, weshalb diese Probenahme möglicherweise vergleichbare Vorteile bietet .
Die Analogie hier ist perfekt: Das Alter wurde von Jahr zu Jahr "gerastert", beginnend mit dem Ursprung Null, und die Zuordnung zu den Gruppen wechselte sich entlang dieses (eindimensionalen) Rasters ab. Einige Vorteile dieses Ansatzes sind die Gewährleistung einer breiten, gleichmäßigen Verteilung der Probe über das Feld oder den Obstgarten (oder in diesem Fall über das Alter), wodurch Einflüsse auf den Ort (oder die Zeit) ausgeglichen werden. Dies kann besonders nützlich sein, wenn die Theorie nahelegt, dass der Ort der vorherrschende Faktor bei der Variation der Reaktion ist. Darüber hinaus werden die Daten bis auf wirklich winzige Stichproben so analysiert, als obEs handelte sich um eine einfache Zufallsstichprobe, die relativ wenig Fehler einführt. Darüber hinaus ist eine gewisse Randomisierung möglich: Im Feld können wir den Ursprung und die Ausrichtung des Gitters zufällig auswählen. Im vorliegenden Fall können wir zumindest randomisieren, ob es sich bei den geraden Jahren um Kontrollpersonen oder Behandlungspersonen handelt.
Ein weiterer Vorteil der Rasterabtastung ist die Erkennung lokalisierter Abweichungen. In der Praxis wären dies "Taschen" ungewöhnlicher Reaktionen. Statistisch können wir sie als Manifestationen räumlicher Korrelation betrachten. Wenn in der gegenwärtigen Situation die Wahrscheinlichkeit besteht, dass in einem relativ engen Altersbereich ungewöhnliche Reaktionen auftreten, ist das Gitterdesign eine ausgezeichnete Wahl, da ein rein randomisiertes Design zufällig große Alterslücken innerhalb einer der Gruppen aufweisen kann. (Ein besseres Konzept könnte jedoch darin bestehen, eine Schichtung vorzunehmen: Verwenden Sie die Altersgleichheit, um zwei analytische Schichten zu bilden , und teilen Sie die Patienten dann unabhängig voneinander in Kontroll- und Behandlungsgruppen ein.)
quelle
Ich bin damit einverstanden, dass Ihr Beispiel ziemlich harmlos ist, aber ...
Wenn die beteiligten Agenten (entweder die Person, die die Intervention ausführt, oder die Personen, die die Intervention erhalten) Kenntnis von dem Zuweisungsschema erhalten, können sie davon Gebrauch machen. Eine solche Selbstauswahl sollte ziemlich offensichtlich sein, warum sie bei den meisten experimentellen Entwürfen problematisch ist.
Ein Beispiel, das mir in der Kriminologie bekannt ist, sieht so aus. Das Experiment sollte die abschreckende Wirkung einer Nacht im Gefängnis nach einem häuslichen Streit testen und den Täter lediglich auffordern, für die Nacht abzureisen. Die Beamten erhielten eine Broschüre mit Blättern, und die Farbe des aktuellen Blatts oben sollte angeben, wie der Täter behandelt wurde. in dem besonderen Vorfall sollte erhalten.
Was am Ende passierte, war, dass die Beamten das Studiendesign absichtlich missachteten und ein Blatt wählten, das auf persönlichen Vorlieben beruhte, was dem Täter angetan werden sollte. Es ist nicht ungewöhnlich zu vermuten, dass in Ihrem Beispiel zumindest ein ähnliches jahrelanges Fudging möglich ist.
quelle
Eine vollständige Randomisierung auf der Grundlage der zufälligen Verteilung ist nicht vorhersehbar. In Ihrem Fall ist bekannt, ob ein Fall vor der Bestätigung der Berechtigung der Intervention oder der Kontrolle zugeordnet wird.
quelle